AI项目与工具

MoMask

MoMask是一款基于生成式掩码建模的3D人体动作生成工具,支持文本驱动的动作创建与编辑。采用分层量化与Transformer架构,实现高精度、连贯的3D动作序列生成,在HumanML3D数据集上的FID值仅为0.045。支持动作时序控制、多平台部署及动作评估功能,适用于游戏开发、动画制作、VR及体育分析等多个领域。

PC Agent

PC Agent是一款基于人工智能的多功能系统,通过模拟人类认知过程,实现复杂数字任务的自动化处理,包括文档编辑、数据分析、项目管理和客户服务等。它采用多智能体系统架构,结合PC Tracker采集的人机交互数据,利用两阶段认知完成流程生成富含认知信息的轨迹,从而支持高效的决策制定与任务执行。

Backflip AI

Backflip AI 是一款基于 AI 技术的 3D 模型生成工具,可将 3D 扫描数据快速转换为 CAD 模型,提升数字设计效率。支持多种文件格式,具备自动修复、智能特征识别等功能,适用于制造业、建筑、文化遗产保护等多个领域。用户可通过不同订阅方案灵活使用,满足多样化需求。

TruMate

TruMate是一款基于AI技术的社交应用,允许用户通过与定制化虚拟角色的文字互动获得情感陪伴和娱乐体验。平台提供丰富的角色筛选选项、沉浸式社交环境以及IP联动功能,支持用户创建个性化虚拟形象,适用于情感支持、社交练习、语言学习等多个场景。

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术,支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域,提供高效且逼真的视觉内容生成能力。

Lovable

Lovable是一款利用自然语言处理技术的AI编程工具,支持用户通过对话生成代码并快速构建网站和Web应用程序。它具备数据库集成、代码同步、大型代码库处理等核心功能,适用于原型开发、非技术团队、独立开发者及企业软件开发等多种场景,显著提升开发效率并降低技术门槛。

VMix

VMix是一款提升文本到图像生成美学质量的工具,通过解耦文本内容与美学描述,并引入细粒度美学标签,增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块,可在不改变原有模型结构的情况下注入美学条件,保持图文一致性。VMix兼容多种扩散模型及社区模块,支持多源输入、高质量视频处理、实时直播与远程协作,广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台,集成了指令优化的多模态大型语言模型(MLLM)及一系列定制化医疗工具,支持多种医学成像模式(如MRI、CT、X射线等),可高效处理视觉问答、分类、定位、分割、医学报告生成(MRG)及检索增强生成(RAG)等任务,显著提升了医疗数据处理效率与准确性。

塔猫AI对话PPT

塔猫AI对话PPT是一款利用深度学习与自然语言处理技术的智能PPT分析工具,可解析文本、图表等内容,支持智能问答、摘要生成及逻辑优化建议等功能。它适用于信息检索、演讲准备、教育培训等多个场景,助力用户高效获取所需信息。

LAYMAN LAW

LAYMAN LAW是一款基于AI的法律辅助工具,能够将复杂法律术语和文件内容转化为通俗易懂的语言。支持PDF文件解析、智能问答、文本摘要生成及浏览器扩展功能,适用于法律专业人士、企业人员及普通用户。帮助用户快速理解法律内容,提升法律素养,降低合规风险。