学习

XMusic

XMusic是腾讯多媒体实验室开发的AI作曲框架,支持多模态输入(如图片、文字、视频等)生成情绪、风格、节奏可控的高质量音乐。其核心技术包括多模态解析、符号音乐表示与生成优化,具备商用级音乐生成能力。适用于视频配乐、互动娱乐、音乐教育、辅助创作及音乐治疗等多个场景,有效降低音乐创作门槛,提升创作效率与个性化体验。

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器,支持视觉生成与理解任务。其采用多码本量化技术,将视觉特征分割并独立量化,显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率,图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块,广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

WiseFlow

WiseFlow 是一个开源的 AI 信息挖掘工具,可以从网站、微信公众号、社交媒体等多源信息中智能提取并分类数据。该工具结合了统计学习和大型语言模型(LLM),优化了对微信公众号文章的解析,并支持多种新闻页面的处理。WiseFlow 设计轻巧,无需 GPU 即可运行,适用于任何硬件环境,是信息过载时代的信息管理理想助手。

CogVideoX

CogVideoX是由智谱AI开发的开源AI视频生成模型,支持英文提示词生成6秒长、每秒8帧、分辨率为720x480的视频。它具备低显存需求、视频参数定制、3D Causal VAE技术和推理与微调功能。该模型采用基于Transformer的架构和3D Causal Variational Autoencoder技术,支持多阶段训练和自动及人工评估,适用于创意视频制作、教育材料、广告、游戏、电影编

有道灵动翻译

一款专为浏览器设计的翻译插件,旨在帮助用户舒适地获取英文信息并将其转化为英文。灵动翻译插件支持一键翻译网页中的文本、图片和对话框等内容。

OpenBMB

OpenBMB作为一个大型的中英文双语基础模型,通过在大规模语料库上的预训练,具备了优秀的语言处理能力。

Yodayo AI | 文本生成动漫图片

Yodayo是一个AI文本生成动漫图片工具,是一款先进的人工智能系统,它可以根据你输入的文字或图片,自动生成出免费、高质量的动漫风格的画面。

有道小P

有道小P是一款专为K12学生设计的AI全科学习助手,涵盖所有学科的答疑需求。其核心功能包括AI查词、AI翻译、互动式学习体验(如AI画图和互动故事)。该工具通过提供个性化的学习建议和资源,帮助学生克服语言障碍,提高学习效率,同时增加学习的趣味性和互动性。

Talkpal AI

Talkpal AI是一款利用GPT技术构建的语言学习平台,支持多语言学习,包括英语、西班牙语、法语和德语等。其主要功能涵盖自适应学习系统、角色扮演、情景对话、听力及口语练习,并提供即时反馈,助力用户提升语言实际应用能力。

CatchMe

一款为识别图片、视频和音频内容是否由人工智能生成而设计的AI内容检测器