推理

InfiMM

InfiMM-WebMath-40B是由字节跳动与中国科学院联合推出的大规模多模态数据集,涵盖大量数学和科学内容,包括文本、公式、符号及图像。该数据集通过筛选、清洗和标注优化,可显著提升多模态模型的数学推理能力。它适用于数学题库生成、学习工具开发、论文理解及科学研究等多个应用场景。 ---

HK

HK-O1aw是一款由香港生成式AI研发中心与北京大学合作推出的专业法律推理大模型,基于深度学习技术和神经网络架构,专注于慢思考和链式推理。它能够深入分析法律文本,提供逻辑严密的法律意见,涵盖合同审查、消费者权益保护、商业调解等多个应用场景,适合法律从业者、教育机构以及普通用户使用。

赤兔Chitu

Chitu(赤兔)是清华大学与清程极智联合开发的高性能大模型推理引擎,支持多种GPU及国产芯片,打破对特定硬件的依赖。其具备全场景部署能力,支持低延迟、高吞吐、小显存优化,并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域,提供高效、稳定的推理解决方案。

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。

讯飞星火X1

讯飞星火X1是科大讯飞推出的基于全国产算力平台训练的大型语言模型,具备深度推理和“慢思考”能力,适用于数学、代码、逻辑推理、文本生成等任务。支持快慢思考统一模型,部署简便,算力需求低。广泛应用于教育、医疗、健康管理等领域,提供精准的智能服务与解决方案。

混元hunyuan

腾讯发布的快思考模型,混元hunyuan-TurboS响应速度较前代产品提升了一倍,首字时延降低了44%。优化后的模型使得即时生成内容流畅,适用于知识、数理和创作等多方面应用。

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型,支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器,具备强大的图像感知、数学推理和OCR能力。在长上下文(128K)和复杂任务中表现优异,尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

Reka Flash 3

Reka Flash 3 是一款由 Reka AI 开发的开源推理模型,拥有 21 亿参数,支持多模态输入(文本、图像、视频、音频),并可处理最长 32k 个令牌的上下文。它具备高效的推理能力和多语言支持,适用于日常对话、编码辅助、指令执行等多种场景。模型可在本地部署,支持 4 位量化以降低资源占用,适合广泛的应用需求。

fal

Fal 是一款面向开发者的 AI 工具平台,专注于音频、视频和图像生成与处理。它具备高性能推理引擎、跨平台支持、自然语言处理功能及实时交互式应用支持。通过灵活的按需付费模式,Fal 可广泛应用于创意设计、广告营销、游戏开发、教育培训和电子商务等领域。

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型,具备结构化推理和透明性,支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试,涵盖4000多个推理步骤,用于全面评估推理能力。其性能优于多个开源模型,适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景,具有高准确性和可解释性。