AI项目与工具

BioMedGPT

BioMedGPT-R1是由清华大学AI产业研究院与北京水木分子生物科技联合开发的多模态生物医药开源大模型。基于DeepSeek R1技术,实现生物模态(如分子、蛋白质)与自然语言的统一融合,支持跨模态问答与深度推理。该模型在药物分子理解、靶点挖掘等领域表现优异,适用于药物设计、临床前研究及医学文本分析等多种场景,具备较高的文本推理能力和多模态处理能力。

Second Me

Second Me 是由心识宇宙开发的开源 AI 身份模型,支持创建个性化且私有的 AI 代理,代表用户的真实自我。它提供 Chat Mode 和 Bridge Mode 两种交互模式,适用于不同场景下的沟通与信息反馈。支持本地运行,保障数据隐私。Second Me 采用分层记忆模型、个性化对齐架构等技术,具备多角色适应、智能记忆管理和链式推理能力,广泛应用于个人助理、职业发展、社交互动、学习辅导

BGE

BGE-VL是由北京智源研究院联合高校开发的多模态向量模型,基于大规模合成数据MegaPairs训练,具备高效的多模态数据合成方法和强大的泛化能力。它支持图文检索、组合图像检索和多模态嵌入等功能,适用于智能搜索、内容推荐、图像编辑辅助等多个领域。模型在多种任务中表现优异,尤其在组合图像检索方面取得显著成果。

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术,结合扩散模型与时间注意力机制,基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块,确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸,广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域,具备高分辨率生成能力和良好的时间连贯性。

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型,利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务,如音乐创作、声音效果设计及语音合成,并可通过ComposableART技术实现对声音属性的精细调控。此外,Fugatto擅长生成动态变化的声音景观,广泛应用于音乐创作、声音设计及广告音频制作等领域。

spiritme

Spiritme是一款基于人工智能的视频创作工具,支持用户通过拍摄或输入文本生成逼真的数字化身视频。其核心功能包括数字化身创建、文本转视频转换、AI辅助拍摄及多语言支持,适用于营销、教育、社交媒体及企业演示等多种应用场景,为用户提供了高效且灵活的视频制作解决方案。

Stablecog

Stablecog 是一款基于人工智能技术的开源图像生成工具,能够根据文本描述或现有图片生成逼真的艺术作品。它支持多种艺术风格,具备图像编辑和调整功能,适用于艺术创作、设计、社交媒体内容制作等多个领域。

Caricaturer

Caricaturer是一款利用深度学习技术的在线AI漫画头像生成工具,能将用户上传的照片转换为64种不同风格的漫画效果。它具备快速生成、高分辨率输出及隐私保护等特点,适用于个人娱乐、艺术创作、企业营销等多个场景。

AIbus

Albus是一款基于ChatGPT的实时白板应用,旨在帮助用户深入探索感兴趣的主题、学习新技能。它具备自动扩展内容、生成问题、搜索图片、创建思维导图等核心功能,同时支持图像生成、语音叙述及多语言对话,可应用于个人学习、创意生成、教育场景及团队协作,提供便捷高效的AI辅助体验。

RealisHuman

RealisHuman 是一个用于优化生成图像中人体部位的后处理框架,采用两阶段方法提升手部和面部等部位的真实性。它通过参考原始图像生成逼真结构,并重新绘制周围区域实现无缝融合,支持多种图像风格,适用于游戏、影视、艺术等领域。