AI

Chirp 3

Chirp 3 是谷歌云推出的高清语音合成工具,支持 31 种语言和 248 种声音,能生成自然流畅的语音。具备多语言支持、自定义语音、流式合成等功能,适用于智能助手、有声读物、视频配音等场景。支持多种音频格式,注重数据安全与合规性。

问小白上线DeepSeek

“问小白”平台提供免费且无限使用的DeepSeek R1满血版服务,支持联网搜索、文件上传、多模态处理等功能,运行流畅稳定。平台在多项实测中表现优异,具备深度思考能力、智能追问及语音交互功能,适用于多种场景,用户体验良好,且完全免费。

咔哒

咔哒是一款基于AI技术的图片处理工具,具备场景识别、滤镜匹配、美颜修图和高级特效等功能,适用于日常拍照、社交媒体分享、专业摄影后期及创意设计等多个场景,旨在通过智能化手段快速提升照片质量并增强视觉效果。

DishGen

DishGen是AI食谱生成器,根据用户输入的食材、食谱想法或饮食偏好,快速生成个性化的食谱和餐饮计划。它基于智能算法,将剩余食材转化为美味菜肴,减少食物浪费并节省金钱。用户可随时修改食谱,保存和分享自己的创作。DishGen提供移动应用,方便随时随地使用,简化烹饪过程,提供个性化体验和健康饮食建议,推动烹饪和餐食规划的未来。

Jodi

Jodi是由中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架,基于联合建模图像域和多个标签域,实现视觉生成与理解的统一。它支持联合生成、可控生成和图像感知三种任务,利用线性扩散Transformer和角色切换机制,提升生成效率和跨领域一致性。Jodi使用Joint-1.6M数据集进行训练,包含20万张高质量图像和7个视觉域标签,适用于创意内容生成、多模态数据增强、图像编辑与修复等场景。

Henshu AI

一款由人工智能驱动的编辑器,将你的内容从普通变为非凡,让你的文字更具吸引力、说服力和影响力。

Verifier Engineering

Verifier Engineering是一种创新的后训练方法,通过搜索、验证和反馈三个阶段优化基础模型性能。它采用目标条件马尔可夫决策过程(GC-MDP),结合线性与树搜索算法,对模型输出进行动态调整。其验证器分类涵盖多种形式和粒度,并支持基于训练和推理的反馈方式。这项技术已在自然语言处理、代码生成、教育和内容安全等领域展现广泛潜力,成为提升模型鲁棒性和智能化水平的重要工具。

Ingredients

Ingredients是一款基于多身份图像与视频扩散Transformer的视频生成框架,支持多身份特征的高效整合与动态分配。其核心模块包括面部提取器、多尺度投影器和ID路由器,能够保持身份一致性并生成高质量视频内容。无需额外训练即可实现个性化视频制作,适用于娱乐、广告、教育等多个领域。

Gatekeep

专门致力于将复杂的数学和物理问题简化为易于理解的视频讲解