AI
Multimodal Live API
Multimodal Live API是谷歌推出的一种支持文本、音频和视频交互的AI接口,具备低延迟、实时双向通信和自然语言处理能力。它允许用户通过多种输入方式与AI互动,并支持会话记忆和外部功能调用,广泛应用于客户服务、在线教育、远程医疗、视频会议和娱乐等领域。
MagicTryOn
MagicTryOn是由浙江大学和vivo等机构开发的视频虚拟试穿框架,采用扩散Transformer(DiT)架构替代传统U-Net,结合全自注意力机制实现视频时空一致性建模。通过粗到细的服装保持策略,整合服装标记与多条件引导,有效保留服装细节。该工具在图像和视频试穿任务中表现优异,适用于在线购物、时尚设计、虚拟试衣间等多种场景。
重磅!百度今日上线搜索AI伙伴,用户可免费进行对话、AI绘画和其他内容创作
百度搜索AI伙伴是一款基于文心大模型的AI搜索对话工具,允许用户通过AI进行对话、创作及其他活动。它提供了多种功能,如AI绘画、AI创作、AI趣味、AI职场效率工具和命理情感服务,旨在为用户提供全面的AI体验。
