AI

Speak APP

Speak APP是一款基于人工智能技术的英语学习工具,主要聚焦于口语练习。它通过模拟对话、实时反馈及个性化课程设计,助力用户提升发音、语法和词汇水平。其功能涵盖视频教学、角色扮演、ChatBot互动及快速练习,广泛应用于个人自学、考试准备、商务交流、旅游英语及面试场景。

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

TrackGo

TrackGo是一种先进的AI视频生成技术,利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中,通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色,适用于影视制作、动画制作、虚拟现实(VR)、增强现实(AR)和游戏开发等多个领域。

VoiceCanvas

VoiceCanvas 是一款开源的多语言语音合成平台,基于 AI 技术提供高质量文字转语音服务,支持超过 50 种语言。用户可通过上传简短音频实现个性化声音克隆,并集成多种语音服务以保障输出质量。平台适用于内容创作、教育、企业及个人等多种场景,提升语音内容制作效率。

通义千问AI大模型

通义千问大模型AI开放平台,覆盖语言、听觉、多模态等领域;致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”

Fourier N1

Fourier N1是一款由傅利叶推出的开源人形机器人,具备23个自由度,可完成复杂动作如单足站立、坡道通行和楼梯攀爬。搭载自研控制系统和FSA 2.0执行器,支持高速稳定运行。支持多模态交互,适用于教学、康复辅助、物流搬运、家务服务及灾难救援等领域,提供全面的开源资源以支持开发与研究。

Teacherbot

有了Teacherbot,教师现在可以为学生制定创造性的、更有效的学习计划。它提供阅读、未来规划、数学、幼儿教育、中小学教育和高等教育的材料,以及帮助和联系方式。 老师们可以使用...

网易见外

网易见外是由网易人工智能事业部研发的AI智能语音转写听翻平台,提供视频听翻、直播听翻、语音转写、文档直翻等功能。

DeepWiki MCP

DeepWiki MCP是Cognition Labs推出的远程服务器,基于开放标准的Model Context Protocol(MCP),为AI应用提供访问和搜索GitHub代码库文档的能力。它包含三个主要工具:获取文档主题列表、查看文档内容以及针对仓库提问获得AI回答。支持SSE和Streamable HTTP传输协议,确保信息实时性和准确性,适用于快速查询文档、技术问题解答、代码库结构概览

Dawn AI

Dawn AI是一款基于AI技术的图像生成工具,支持文本转图像、多种绘画风格选择以及头像生成等功能。用户可通过输入文字或上传图片,快速生成艺术作品。界面简洁易用,适合各类用户,适用于社交媒体、创意内容制作及角色定制等多种场景,提升创作效率与个性化表达。