OmniTalker OmniTalker 是一款由阿里巴巴开发的实时多模态交互技术,支持文本、图像、音频和视频的同步处理,并能生成自然流畅的语音响应。其核心技术包括 Thinker-Talker 架构和 TMRoPE 时间对齐技术,实现音视频精准同步与高效流式处理。适用于智能语音助手、内容创作、教育、客服及工业质检等场景,具有高实时性与稳定性。 AI项目与工具 2025年06月12日 59 点赞 0 评论 716 浏览
Generative Omnimatte Generative Omnimatte 是一种基于 AI 的视频编辑技术,通过其核心模型 Casper 实现视频的多层次分解与编辑。它能够自动分离物体与背景,并支持动态背景处理及多对象场景的精细编辑。主要功能包括视频分层、对象移除、背景替换、Trimask 控制等,广泛应用于电影制作、广告设计、游戏开发及虚拟现实领域。 AI项目与工具 2025年06月12日 10 点赞 0 评论 716 浏览
Microsoft Designer Microsoft Designer 是一种使用人工智能来帮助您设计文档、图像和社交媒体帖子的工具。 Ai图片处理 2025年06月05日 27 点赞 0 评论 716 浏览
Globavoc海外消费者洞察 GlobaVoc是一款面向全球VoC(Voice of Customer,即客户声音)市场的AI SaaS产品,专注于从消费者评论中挖掘产品机会,尤其适合关注用户体验的品牌出海商家。 创作工具 2026年06月25日 0 点赞 0 评论 716 浏览
[]万兴PDF编辑器 万兴PDF编辑器是一款功能丰富的PDF处理软件,它通过提供直观的用户界面和强大的编辑工具,使用户能够轻松地完成PDF的创建、编辑、转换和保护等任务。 排版编辑 2026年06月25日 0 点赞 0 评论 717 浏览
Thetawave AI Thetawave AI 是一款面向大学生的智能笔记工具,支持实时课堂转录、视频内容提炼、PPT 内容整理等功能。它能自动生成结构化笔记,并提供聊天机器人、思维导图、Flashcard 和 Quiz 等辅助学习工具,提升学习效率与知识整理能力。 AI项目与工具 2025年06月12日 14 点赞 0 评论 717 浏览
FaceShot FaceShot是由同济大学、上海AI Lab和南京理工大学联合开发的无需训练的肖像动画生成框架。通过外观引导的地标匹配和基于坐标的地标重定位模块,生成精确的面部地标序列,并结合预训练模型生成高质量动画。其优势在于无需训练、跨领域适配性强、兼容性好,适用于影视、游戏、教育、广告及VR/AR等多个应用场景。 AI项目与工具 2025年06月11日 15 点赞 0 评论 717 浏览
产品周刊 | Product Weekly Herbert Chang创办的一个专注于产品行业的周刊。每期内容包括新产品介绍、行业观点以及推荐书目等。 独立开发 2025年06月05日 64 点赞 0 评论 719 浏览