AI项目与工具

天壤万卷

天壤万卷是一款基于AI的文档处理工具，支持多格式文档（含超大文件和扫描件）的处理。其核心功能包括混合检索、跨语言问答、精准定位和溯源答案，同时配备表格、图像、公式识别等实用工具及行业模板，适用于法律、学术、金融等多个领域。

AI项目与工具 2025年06月12日 24 点赞 0 评论 791 浏览

ColorFlow

ColorFlow是一款由清华大学与腾讯ARC实验室联合研发的图像序列着色模型，具备检索增强、上下文学习及超分辨率技术，能够精准保持个体身份并实现高质量着色。该工具在漫画、动画制作、老照片修复及艺术创作等领域具有广泛应用价值，同时支持学术研究和技术探索。

AI项目与工具 2025年06月12日 96 点赞 0 评论 791 浏览

MyMap.AI

MyMap.AI是一款基于AI技术的智能图表制作平台，支持用户通过自然语言交互快速生成思维导图、流程图、矩阵图和演示文稿。其核心功能包括AI驱动的图表生成、多格式文件支持、实时网络搜索、信息提取以及多人实时协作。适用于教育、商业、创意和个人生产力等多个场景，帮助用户高效完成图表制作并提升工作效率。

AI项目与工具 2025年06月12日 39 点赞 0 评论 791 浏览

Markable AI

Markable AI 是一款基于AI技术的电商营销工具，支持图像与视频商品识别，并提供深度链接生成、拼贴图制作、亚马逊集成等功能。适用于创作者进行内容推广、电商营销和数据分析，提升内容转化率与收入。平台兼容多个电商平台，优化推广策略，提高运营效率。

AI项目与工具 2025年06月11日 92 点赞 0 评论 791 浏览

天谱乐

天谱乐是一款由趣丸科技推出的支持多模态输入的音乐生成工具，涵盖文本、图片及视频生成音乐功能。它能够准确理解音乐复杂特性并生成高契合度配乐，同时提供专家模式和音乐编辑功能，适用于音乐创作、短视频配乐、影视配乐及个人娱乐等多个领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 791 浏览

FlexiAct

FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型，可在空间结构差异较大的场景下实现精准动作迁移，并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取（FAE），有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域，具有良好的应用前景。

AI项目与工具 2025年06月11日 39 点赞 0 评论 792 浏览

VQAScore

VQAScore是一种基于视觉问答（VQA）模型的评估工具，用于衡量文本提示生成图像的质量。它通过计算回答“是”概率的方式评估图像与文本提示的对齐程度，无需额外标注，提供更精确的结果。VQAScore支持多种生成任务，包括图像、视频及3D模型，并能作为多模态学习的研究工具，在自动化测试和质量控制中发挥重要作用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 792 浏览

图应

图应是一款基于AIGC技术的AI商拍工具，专为电商领域设计，通过AI生成高质量商品图像，支持模特与场景定制，具备智能编辑功能。其应用场景涵盖广告创意、印刷出版、服装时尚等领域，显著提升商业视觉效果，降低拍摄成本并提高效率。

AI项目与工具 2025年06月12日 60 点赞 0 评论 792 浏览

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 792 浏览

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架，基于音频条件的潜在扩散模型，无需中间3D或2D表示，可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法，提升视频时间一致性，并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 792 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间