模型

Eagle

Eagle是一个由英伟达开发的多模态大模型,专长于处理高分辨率图像,提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构,通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源,适用于多个行业,具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

左医医疗大语言模型

左手医生通过开放平台赋能医疗健康行业,为医疗机构、信息化厂商、医药企业、连锁药店、健康管理机构、智能硬件等合作伙伴提供多种类型的高质量智能医生服务。

TIP

TIP-I2V是一个包含大量真实文本和图像提示的数据集,专为图像到视频生成领域设计。它涵盖了超过170万个独特的提示,并结合多种顶级图像到视频生成模型生成的视频内容。该数据集支持用户偏好分析、模型性能评估以及解决错误信息传播等问题,有助于推动图像到视频生成技术的安全发展。

DuoAttention

DuoAttention是由MIT韩松团队提出的新型框架,通过区分“检索头”和“流式头”两种注意力机制,显著提升了大型语言模型在处理长上下文时的推理效率。该框架有效减少了内存占用,加速了解码和预填充过程,并保持了模型的准确性。它适用于多轮对话、长文档处理、学术研究以及内容推荐等多个领域。

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力,通过创新的梯度条件方法和自回归扩展技术,生成了具有高度时间连贯性和质量的视频样本。

STORM AI

STORM AI 是一款由斯坦福大学开发的开源AI写作工具,能够快速将一个主题转化为长篇文章或研究论文。它利用大语言模型(LLM)进行多角度提问和模拟专家对话,生成深入且准确的内容。STORM AI 可以自动收集资料、生成大纲,并最终形成完整的文章。其主要功能包括基于互联网搜索撰写文章、多角度提问、模拟专家对话、生成研究大纲以及引用和参考资料管理。此外,STORM AI 还能够自动化研究过程,为写

SPAR

SPAR是一种自我博弈框架,专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动,利用树搜索技术和迭代优化,提升模型的自我完善能力。实验显示,SPAR在多个基准测试中表现出色,适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。

WPS AI

WPS AI是金山办公推出的一款具备大语言模型能力的生成式人工智能应用,也是中国协同办公领域的首个类ChatGPT式应用。它主要面向办公、写作和文档处理,旨在通过AI技术提升用户的工...

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架,基于扩散变换器和3D面部几何先验,实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术,提升面部动态表现,同时保持身份稳定性。支持多种应用场景,如虚拟形象、内容创作和数字人交互,具备无需微调的高效生成能力。