AI项目与工具

UniAct

UniAct是一款面向具身智能的通用行为建模框架，旨在解决机器人行为异构性问题。通过向量量化构建通用动作空间，UniAct将不同机器人的原子行为统一表示，实现跨平台共享。其轻量架构（如0.5B模型）具备高效性能与快速适应能力，仅需少量数据即可微调，并通过异构解码器适配多种机器人。适用于自动驾驶、医疗、工业及家庭服务等多个领域，提供一致且高效的控制方案。

AI项目与工具 2025年06月12日 14 点赞 0 评论 565 浏览

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具，其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色，生成自然流畅的语音，并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行，也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

AI项目与工具 2025年06月12日 49 点赞 0 评论 565 浏览

VideoRefer

VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统，基于增强型视频大型语言模型，实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准，支持对象识别、关系分析、推理预测及多模态交互等功能，适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 564 浏览

琴乐大模型

琴乐大模型是一款由腾讯AI Lab与腾讯TME天琴实验室联合开发的人工智能音乐创作工具。该工具能够根据用户输入的关键词、描述性语句或音频，生成高质量的立体声音频或多轨乐谱，并支持自动编辑功能。琴乐大模型采用先进的技术框架，包括音频文本对齐、乐谱/音频表征提取、大语言模型预测以及流匹配和声码器技术，确保生成的音乐符合音乐理论和人类审美标准。

AI项目与工具 2025年06月12日 33 点赞 0 评论 564 浏览

qbiq

Qbiq是一款基于生成式AI技术的空间规划平台，能够根据用户需求在24小时内生成多个优化的2D布局方案及3D可视化模型。平台提供详细的分析报告，涵盖日光、密度、隐私等关键指标，帮助用户进行数据驱动决策。无需专业背景，用户可轻松使用，适用于房地产开发、建筑设计、房产经纪等多个领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 564 浏览

NovaMSS

NovaMSS是一款基于AI技术的音乐源分离工具，可精准分离人声、伴奏、贝斯、鼓点等音轨。支持多种音频格式和批量处理，操作简便，适用于音乐制作、音频修复及教学资源开发等多种场景。提供普通与专业模型，满足不同用户的音质需求，适合创作者和音乐爱好者使用。

AI项目与工具 2025年06月12日 90 点赞 0 评论 564 浏览

FutureKid

FutureKid是一款基于AI技术预测孩子未来长相的应用，通过分析父母面部特征生成逼真图像。它支持个性化定制，注重隐私保护，确保数据安全。适用于家庭规划、婚礼纪念及创意设计等多种场景，提供简单高效的用户体验。

AI项目与工具 2025年06月12日 14 点赞 0 评论 564 浏览

Umi

Umi-OCR 是一款离线 OCR 工具，支持图片、截图和 PDF 文档的文字识别，具备数学公式与二维码识别功能，可生成可搜索 PDF。支持多语言识别与界面切换，提供命令行和 HTTP 接口调用，适用于文档数字化、数据录入、教育等多个场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 564 浏览

DragAnything

DragAnything 是一款由快手与高校联合研发的视频生成工具，通过实体表示和轨迹输入实现对视频中物体的精确运动控制。它支持多实体独立操作、相机运动调整，并采用扩散模型生成高质量视频内容。具备用户友好的交互方式，适用于视频编辑、游戏开发、教育及广告等多个场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 564 浏览

BEHAVIOR Robot Suite

BEHAVIOR Robot Suite（BRS）是斯坦福大学李飞飞团队研发的机器人操作框架，专注于实现全身协调与复杂家务任务。它结合了低成本遥操作接口JoyLo和多模态学习算法WB-VIMA，提升机器人在真实环境中的适应性和操作精度。适用于家务自动化、垃圾处理、衣物整理等多个场景，具备高度灵活性和故障恢复能力。

AI项目与工具 2025年06月12日 93 点赞 0 评论 563 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间