AI

Snipo

Snipo是一款基于AI的浏览器扩展工具,专为视频学习和笔记管理设计。它支持用户在观看视频时添加时间戳笔记、截取关键画面,并通过AI生成闪卡,同时具备与Notion无缝集成的功能。Snipo适用于在线学习、视频内容分析、语言学习、会议记录及教育培训等多种场景,显著提升学习和工作的效率。

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架,支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略,实现长上下文处理与主动响应。项目配套发布Stream-IT数据集,包含60万样本,适用于多种视频理解任务,展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。

Rodin

Rodin是一款由影眸科技开发的AI驱动3D生成工具,专注于快速生成高质量的3D模型。它支持文本提示和图片输入生成3D资产,具备多视图融合、模型调整及材质生成等功能,适用于游戏开发、角色建模、虚拟现实等多种场景,同时兼顾生成效率与细节表现,但需进一步优化精度与数据集适应性。

出海去

一个专为独立创客、一人公司和小微团队设计的新型社区孵化器,出海去目的在于帮助中国AI/SaaS创业团队和独立开发者走向国际市场。

多面

多面是一款基于AI技术的招聘平台,提供AI在线面试、智能评估与模拟面试等功能,助力求职者提升面试能力,帮助企业高效筛选人才。平台支持多种招聘场景,具备智能管理、简历解析、批量邀约等实用功能,提升招聘效率与精准度。

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架,结合大型语言模型与视频扩散模型,实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入,精确控制摄像机运动轨迹,具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果,并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域,提高视频创作效率与质量。

Step

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

木言AI

专注于文字语音合成配音、字幕配音、智能视频创作的全自动化在线工具。制作视频无需出镜,木言AI是新自媒体人必不可少的工具!