AI - 智狐AI导航

Ola

Ola是一款由多机构联合开发的全模态语言模型，支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略，逐步扩展模型的多模态理解能力，同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器，结合局部-全局注意力机制，实现高效多模态处理，在多项任务中表现优异。

AI项目与工具 2025年06月12日 98 点赞 0 评论 723 浏览

Splitter.ai

Splitter.ai是一款基于人工智能技术的音频处理平台，能够实现音乐中的人声与乐器分离、混响消除以及多音轨分离等功能。它支持云端操作、多平台兼容，并广泛应用于音乐制作、音频编辑、卡拉OK伴奏制作及音频取证等领域。凭借其强大的AI算法和灵活的操作方式，Splitter.ai成为音乐工作者和音频爱好者的理想工具。

AI项目与工具 2025年06月12日 48 点赞 0 评论 723 浏览

Video Dubbing

一款具有语音克隆和口型同步功能的AI视频翻译器，可以将视频中的语音转换成多种不同的语言，同时保持与原始视频的音频同步。

Ai语音工具 2025年06月05日 28 点赞 0 评论 723 浏览

ChopperBot

ChopperBot是一款基于AI的直播内容管理工具，支持多平台直播视频的自动抓取、智能剪辑、封面生成及一键上传。通过模块化设计和灵活插件支持，用户可轻松实现个性化内容创作和多平台分发。其核心技术包括视频处理、人工智能分析和自然语言生成，旨在提升直播主和内容创作者的工作效率。

AI项目与工具 2025年06月12日 73 点赞 0 评论 723 浏览

AiSofiya

Sofiya是一款由人工智能驱动的文本到语音转换器，可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率，并有一个强大的声音工作室，以合并和增强...

Ai语音工具 2026年06月29日 0 点赞 0 评论 723 浏览

InstructMove

InstructMove是由东京大学与Adobe合作开发的图像编辑模型，基于视频帧对变化学习如何根据指令进行图像操作。它能够执行非刚性编辑、视角调整和元素重排等任务，同时支持精确的局部编辑。该模型采用真实视频数据训练，提升编辑自然性与真实性，适用于影视、广告、设计等多个领域。其技术基于多模态语言模型和扩散模型，结合掩码和ControlNet等控制机制，实现灵活高效的图像编辑。

AI项目与工具 2025年06月12日 21 点赞 0 评论 723 浏览

VirSci

VirSci是一款基于大型语言模型（LLMs）的多智能体AI科学研究工具，通过模拟科学家团队合作加速科研创新。其主要功能包括合作者选择、主题讨论、创意生成、新颖性评估、摘要生成及自我审查等，支持从团队组建到科学发现的全流程。VirSci具备强大的自然语言处理能力、数字孪生技术和知识库支持，广泛应用于科学研究、团队协作、教育和项目管理等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 723 浏览

Genspark AI幻灯片

一款能够快速将如PDF、Excel、Word等数据格式转化为专业PPT幻灯片的工具，支持一句话交互修改、艺术风格化设计，并可导出为PPTX、PDF等格式

PPT资源 2025年06月05日 71 点赞 0 评论 723 浏览

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 723 浏览

Coursera学习课

Ai编程建站 2026年06月29日 0 点赞 0 评论 723 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期

Ola