AI

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统,基于大量中文语音数据训练,支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能,适用于智能助手、内容创作及无障碍通信等场景,技术上融合了语音-文本联合建模与多阶段训练策略,提升语音表现力与智能化水平。

vidyo.ai

Vidyo.ai是一款基于人工智能的视频编辑工具,可将长视频自动剪辑为适合社交媒体的短视频片段。其主要功能涵盖智能剪辑、尺寸适配、字幕生成、播放速度调节及音频优化等。该工具支持多语言操作,适合内容创作者和品牌方高效制作高质量视频内容。

Dream Machine AI

Luma Labs 开发的一种先进的AI模型,可以通过文本和图像快速生成运动流畅、具有电影品质和戏剧元素的 5 秒视频剪辑,将静态快照转变为动态故事。

Aria

Aria是首个开源多模态原生混合专家(MoE)模型,支持文本、代码、图像和视频的综合处理,具有强大的多模态任务处理能力和长上下文窗口,可高效应对复杂长数据。模型开源且可扩展,适用于多模态AI领域的研究与应用。

Aidge

Aidge是阿里巴巴国际数字商业集团推出的AI电商运营平台,集成了翻译、虚拟模特生成和图像处理等功能,旨在提升跨境电商效率与用户体验。平台提供API接口,支持多语言开发,适用于多种电商场景,如产品推广、客服支持和本地化营销,助力商家降低成本、提高转化率。

BlazeSQL

BlazeSQL是一款结合了自然语言处理与SQL查询功能的人工智能驱动数据分析工具。它支持多类型数据库连接,具备强大的安全性和隐私保护机制,允许非技术人员轻松执行复杂的数据分析任务。通过提供个性化的仪表板和智能化的洞察推荐,BlazeSQL显著提高了工作效率,广泛适用于业务分析、决策支持、客户服务等多个领域。

Seedream 3.0

Seedream 3.0是字节跳动推出的AI图像生成模型,支持2K高清输出,3秒内生成高品质图像。优化了小字排版与结构准确性,具备商业级设计能力,适用于海报、插画、电商设计等多场景。支持中英文双语输入,提供高效、精准的图像生成解决方案,适用于设计师与创作者。

RenderForest

RenderForest,人工智能 LOGO生成器,基于文本描述生成视觉内容的算法,以及细分行业和风格的 LOGO 模板,帮你更加精准地生成 LOGO。

Call Annie

Call Annie是一款基于AI技术的对话工具,通过视频通话形式提供虚拟AI助手Annie,支持实时交流和多种应用场景。主要功能包括实时视频通话、自然语言处理、个性化协助和多平台访问,适用于语言学习、情感陪伴、信息查询、旅行规划、教育辅导及职业发展等场景。