语言处理

LIGER

LIGER是一种由Meta AI等机构研发的混合检索模型,结合生成式检索与密集检索技术,提升推荐系统的效率与准确性。其核心功能包括高效生成候选项目、优化排序、处理冷启动问题及融合语义信息。LIGER通过多目标优化和语义融合机制,显著提高了推荐的精准度与适应性,广泛应用于电商、内容、社交及教育等领域。

ViLAMP

ViLAMP是由蚂蚁集团与中国人民大学联合开发的视觉语言模型,专为高效处理长视频设计。采用混合精度策略,支持在单张A100 GPU上处理长达3小时的视频,提升处理效率并降低计算成本。具备长视频理解、关键信息提取、多任务处理等功能,适用于教育、监控、直播、影视制作及智能客服等场景。技术上通过差分关键帧选择与特征合并优化性能,实现精准且高效的视频分析。

Adobe Firefly

Adobe Firefly 是 Adobe 开发的一系列生成式 AI 工具,支持图像生成、编辑、视频生成及编辑等功能。它通过深度学习算法和自然语言处理技术,实现从文本到图像或视频的快速转化,同时支持多语言操作,适用于创意设计、视频制作、企业内容生产等多个场景,助力用户提升工作效率与创意表达能力。

般若AI

提高你的工作效率,提供生活上的便利。般若AI可以帮助人们回答问题,解决诸如文章写作、语言翻译、客服对话、还有强大的AI绘画等多种场景下的需求。

OmniThink

OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架,通过模拟人类学习和反思机制,提升文章的知识密度与深度。支持多种语言模型,具备信息树与概念池结构化管理功能,适用于学术写作、新闻报道、教育内容创作等多个领域,有效提高生成内容的质量与多样性。

Neural4D 2o

Neural4D 2o 是一款基于多模态数据训练的 3D 大模型,支持文本、图像、3D 和运动数据输入,实现高精度的 3D 内容生成与编辑。具备上下文一致性、角色身份保持、换装和风格迁移等功能,支持自然语言指令操作。采用 Transformer 编码器与 3D DiT 解码器架构,原生兼容 MCP 协议,提升创作效率与交互体验,适用于 3D 内容创作、游戏开发、影视动画等多个领域。

Excelmatic AI

一款 AI 驱动的 Excel 数据分析与可视化工具,支持上传.xlsx和.xls文件,用户可通过自然语言处理直接提问,快速获取自动生成的图表、数据洞察,实现数据清理、公式自动化等功能。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

deepjudge

DeepJudge是一款面向法律行业的AI搜索工具,采用RAG技术和自然语言处理,帮助法律人员快速从海量文档中获取所需信息。它具备语义融合搜索、文档自动分类与标签化、个性化定制等功能,并能识别查询意图以提供精准结果。DeepJudge适用于案件研究、合同审查、合规性检查等多种应用场景,有助于提升法律团队的工作效率和协作能力。