AI

淘金阁

淘金阁自媒体内容全网搜索引擎,是专门什对自媒体作者查看文章做分析使用的网站新媒体文章工具

OpenUtau

OpenUtau 是一款开源的歌声合成工具,支持 UTAU 音源库和 VSQX 格式,具备音素编辑、颤音控制、多语言界面等功能,适用于音乐创作与虚拟歌手合成。它兼容 Windows、macOS 和 Linux,提供预渲染与实时预览,提升创作效率,适合音乐人、开发者及音频爱好者使用。

MiniCPM 4.0

MiniCPM 4.0是面壁智能推出的高效端侧大模型,包含8B和0.5B两种参数规模。其采用创新稀疏架构和三值量化技术,实现模型体积缩小90%并保持高性能。自研CPM.cu推理框架在极限场景下可提升220倍速度,支持多种开源框架部署,并适配主流芯片。具备高效双频换挡机制、多平台适配和多种版本选择,适用于智能辅导、医疗辅助、客服、游戏剧情生成等场景。

ChatMax聚言

ChatMax聚言是一个利用大模型技术为企业解锁专家级数字员工的平台。它通过垂直行业模型,提供自然语言交互和易于使用的AI服务,满足不同工作流程的需求。

PPT.cn

PPT.cn 是一个基于 AI 技术的智能 PPT 制作平台,用户输入主题或上传文档后,系统可快速生成逻辑清晰、视觉效果出色的 PPT 框架和内容。平台提供上千套涵盖多行业的精美模板,支持多种风格和格式导出,适用于职场汇报、提案演示、课程讲解、产品介绍和个人项目展示等多种场景。

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

TIGER

TIGER是由清华大学研发的轻量级语音分离模型,采用时频交叉建模策略与多尺度注意力机制,有效提升语音分离性能,同时显著降低计算和参数开销。模型通过频带切分优化资源利用,适应复杂声学环境,广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

Keevx

Keevx是一款专注于AI数字人视频创作的工具,主要面向海外中小企业和个人创作者。它提供AI智能脚本生成、翻译功能,搭配优质公共人像和模板,支持一键生成营销视频。用户可上传自有脚本,选择数字人形象和语音来制作视频,适用于电商产品展示、员工培训、社交媒体内容创作及品牌宣传等场景。

新言意码

新言意码是一家专注于AI编程应用开发的科技公司,提供代码生成、补全、审查、优化、测试及智能搜索等功能,支持多语言开发。其产品适用于软件开发、教育学习、代码维护、团队协作及快速原型构建等多种场景,旨在提升开发效率和代码质量。公司成立于2024年,已获得多轮投资,估值达8000万美元。

MagicAvatar

MagicAvatar由字节跳动开发,是一款主打多模态输入生成的多模态框架,可以将文本、视频和音频等不同输入方式转化为动作信号,从而生成和动画化一个虚拟人物。