语言模型

ComfyGen

ComfyGen是一款基于大型语言模型(LLM)的文本到图像生成系统,能够根据用户提供的文本提示自动生成高质量图像。它通过结合多种专业组件如微调基础模型、LoRAs、嵌入技术和超分辨率处理等构建复杂工作流,并采用两种基于LLM的方法优化图像生成质量,适用于艺术创作、游戏开发、广告设计、电影制作等多个领域。

Satori

Satori是一款由MIT和哈佛大学等机构联合开发的7B参数大语言模型,专注于提升推理能力。其采用COAT机制和两阶段训练框架,结合强化学习优化模型性能,具备自回归搜索、数学推理、跨领域任务处理以及自我纠错等核心能力。Satori在数学和逻辑推理任务中表现突出,广泛应用于科研、教育、智能客服等多个领域,代码、数据和模型均已开源。

Consensus

Consensus 是一款基于人工智能技术的学术搜索引擎,整合了大型语言模型和向量搜索技术,能够高效检索和理解超过两亿篇同行评审的科学文献。它具备快速搜索、AI 生成摘要、Consensus Meter 和证据支持答案等功能,有效减少误导信息传播,增强信息可信度。适用于学术研究、文献综述、医学研究、教育等领域,助力用户高效获取科学知识并做出数据驱动型决策。

讯飞星火认知大模型

讯飞星火认知大模型是由科大讯飞发布的大模型,具有7大核心能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互,对标ChatGPT。

CleanS2S

CleanS2S是一款流式语音到语音交互智能体原型,通过集成自动语音识别(ASR)、大型语言模型(LLM)、文本到语音(TTS)以及WebSockets等技术,提供高质量、实时的语音交互体验。它支持全双工交互和打断功能,可整合网络搜索和RAG模型以增强回答能力,适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。

ScreenAI

ScreenAI是一款专为理解和处理用户界面(UI)及信息图表而设计的AI视觉语言模型。它能够识别和理解UI元素及其相互关系,并生成与屏幕UI元素相关的文本,如问题回答、UI导航指令和内容摘要。ScreenAI通过多模态编码器结合视觉和语言信息,并采用自回归解码器生成自然语言响应。此外,ScreenAI还能适应不同屏幕格式,提供精确的UI导航和内容摘要功能。

AMD

AMD-135M是一款由AMD开发的小型语言模型,基于LLaMA2架构,具有文本生成、代码生成、自然语言理解和多平台兼容性等特点。该模型通过推测解码技术提高了推理速度,降低了内存占用,并在多项自然语言处理任务中表现出色。适用于聊天机器人、内容创作、编程辅助、语言翻译和文本摘要等多种应用场景。

aisuite

Aisuite是一款基于Python开发的开源库,提供统一接口以调用多个大型语言模型(LLM),支持OpenAI、Anthropic、Azure等多个平台。它简化了模型切换和对比测试流程,并具备良好的扩展性,适用于聊天补全、模型对比测试及个性化推荐等应用场景。

MaxKB

MaxKB是一款开源AI知识库问答系统,支持文档上传、在线文档爬取、文本自动拆分和向量化。它兼容多种大语言模型,包括本地私有和公共模型,提供灵活的工作流引擎和多格式文档支持。MaxKB采用先进的技术如大型预训练语言模型、自动化文档处理、检索增强生成(RAG)技术和向量数据库技术,适用于企业内部知识库、客户服务、教育与培训等多个领域。

文心大模型X1

文心大模型X1是百度开发的深度思考型AI模型,具备中文知识问答、逻辑推理、文学创作等能力,支持多模态内容生成与工具调用。采用递进式强化学习与端到端训练技术,结合飞桨平台实现高效推理。适用于文学创作、文案生成、学术研究、代码开发等多个领域,提供高性价比的AI服务。