模型

福棠·百川

福棠·百川是全球首个儿科大模型,由国家儿童医学中心等机构联合研发,具备强大的临床推理能力和循证医学模式,整合了海量医疗数据和专家经验,可提供个性化诊疗方案。该模型应用于基层和专家版,分别服务于日常诊疗和疑难病诊断,已在北京儿童医院投入使用,诊断准确率达95%。同时支持在线问诊、远程会诊、教育及科研等多场景应用。

StoryPlay AI

一个致力于为短剧内容创作提供可视化流程,实现剧本策划、剧本创作、剧本分镜创作等围绕短剧创作全工作流的AI赋能,实现创作者5-10倍的降本增效的AI短剧剧本创作工具

VideoLLaMA3

VideoLLaMA3 是阿里巴巴开发的多模态基础模型,支持视频与图像的深度理解和分析。基于 Qwen 2.5 架构,结合先进视觉编码器与语言生成能力,具备高效时空建模与多语言处理能力。适用于视频内容分析、视觉问答、字幕生成等场景,提供多种参数版本,支持灵活部署。

自得语音

自得语音技术可通过简单的步骤创造出属于你的角色。类似GPT,可生成与真人无异的语音片段,在情感、音色和语速等方面与真人一致。

Mistral Saba

Mistral Saba 是一款面向中东和南亚地区的定制化 AI 模型,具备 240 亿参数,专注于阿拉伯语及南亚语言(如泰米尔语、马拉雅拉姆语)的处理。其优势在于高效部署、低资源占用和高准确性,适合需要文化背景理解的场景。可通过微调应用于多个行业,并支持 API 和本地部署,适用于对话支持、专业领域知识生成及文化内容创作。

STIV

STIV是一款由苹果公司开发的视频生成大模型,具有8.7亿参数,擅长文本到视频(T2V)及文本图像到视频(TI2V)任务。它通过联合图像-文本分类器自由引导(JIT-CFG)技术提升生成质量,并结合时空注意力机制、旋转位置编码(RoPE)及流匹配训练目标优化性能。STIV支持多种应用场景,包括视频预测、帧插值、长视频生成等,适用于娱乐、教育、广告及自动驾驶等多个领域。

LMEval

LMEval是谷歌推出的开源框架,用于简化大型语言模型(LLMs)的跨提供商评估。它支持多模态(文本、图像、代码)和多指标评估,兼容Google、OpenAI、Anthropic等主流模型提供商。LMEval基于增量评估引擎,节省时间和计算资源,并通过自加密的SQLite数据库安全存储评估结果。LMEvalboard提供交互式可视化界面,帮助用户分析模型性能并直观比较不同模型的优缺点。

CoA

CoA是由谷歌开发的多智能体协作框架,用于解决大语言模型在处理长文本任务时的上下文限制问题。它将长文本分割成多个片段,由多个智能体依次处理并通过链式通信传递关键信息,最终由管理智能体整合生成结果。该框架无需额外训练,支持多种任务类型,如问答、摘要和代码补全,且具有高效性和可扩展性。其时间复杂度优化显著提升了处理长文本的效率。

Wordware

Wordware是一个强大的AI应用开发工具,它通过自然语言编程简化了AI代理的创建过程,提供了先进的技术能力和用户友好的界面。