数据

EzAudio

EzAudio是一款基于文本到音频(Text-to-Audio, T2A)生成模型,通过优化的扩散变换器架构和高效的数据训练策略,实现了快速生成高质量音频的功能。它支持多种应用场景,如音乐创作、影视后期制作、语音合成等,并具备高保真度和低资源消耗的特点。

外链兔

一款专业的私域获客工具,主要功能包括链接一键添加好友、广告数据回传、私域获客等。外链兔支持从抖音、快手、百度、知乎等平台一键跳转加好友,并且可以在广告投流、私信获客、粉丝群获客等场景中使用。

Rizzle AI

Rizzle AI使用 AI 可以轻松创建视频,即使您没有任何视频编辑技能。您只需输入文本,选择一个模板,然后让 Rizzle 完成剩下的工作。

钉钉宜搭

钉钉宜搭是阿里巴巴推出的低代码应用开发平台,帮助企业快速搭建数字化业务应用。通过可视化拖拽和配置,无需代码或仅需少量代码即可完成应用开发,降低开发门槛和成本。提供丰富的组件库,支持表单设计、流程设计、数据统计分析等功能,具备集成云原生和钉原生能力,支持多语言和国际化,适用于人力资源管理、采购流程管理、销售数据分析等多种场景。

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架,由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导,提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态,提供高分辨率基准数据集HR-VVT,适用于在线购物、时尚设计、影视制作等多个领域。

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具,用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对,覆盖8大领域及26类认知任务,强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证,确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域,推动AI模型在多模态场景下的性能提升。

Wren AI

Wren AI 是一个开源的文本到 SQL 工具,基于自然语言处理技术,允许用户通过自然语言提问来执行数据库查询,无需编写 SQL 代码。它支持多种数据库和数据源,具有语义理解能力,能准确解析业务上下文并提供精确的结果。Wren AI 的核心功能包括语义引擎、向量数据库和大型语言模型,支持数据集成、安全性和结果导出,广泛应用于业务智能分析、数据探索、报告生成等领域。

Piktochart

一款AI驱动的信息图表制作工具,允许您创建专业而漂亮的信息图表、传单、海报、报告、通讯和图表。无需任何设计经验。

Humata

Humata.ai,基于GPT的AI文档分析、阅读和问答工具。

T2V

T2V-Turbo 是一种高效的文本到视频生成模型,能够快速生成高质量视频,同时确保文本与视频的高度一致性。它通过一致性蒸馏技术和混合奖励机制优化生成过程,适用于电影制作、新闻报道、教育及营销等多个领域,支持从创意草图到成品视频的全流程加速。