AI项目与工具

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架,由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导,提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态,提供高分辨率基准数据集HR-VVT,适用于在线购物、时尚设计、影视制作等多个领域。

FocuSee

FocuSee是一款智能化屏幕录制软件,具备自动缩放、光标跟踪及动态变焦功能,能将普通屏幕录制升级为专业级视频。支持多布局定制、字幕添加、水印嵌入以及跨平台导出与分享,适用于教学、产品演示、营销推广、软件教程等多种场景,大幅降低后期编辑成本,提升视频制作效率。

Stable Diffusion整合包

Stable Diffusion整合包是一款专为新手用户设计的本地部署解决方案,由B站UP主秋葉aaaki开发。它包含Stable Diffusion WebUI、必要的运行环境、预装模型及常用插件,使得用户无需复杂的技术背景就能便捷地安装和使用AI绘画工具。最新版本支持自动更新和多版本切换,并提供了丰富的预装资源和汉化界面,极大地简化了环境配置过程。

Robin AI

Robin AI是一款专注于法律领域的AI工具,通过自然语言处理和机器学习技术,帮助用户高效审查合同、识别风险并优化管理流程。其核心功能包括合同即时审查、条款查询、集成Word、合同分类管理及数据分析。适用于法律事务所、企业法务、金融、房地产和供应链等多个行业,提升合同处理效率与合规性。价格方案灵活,涵盖个人、专业及企业级用户需求。

Social Media Agent

Social Media Agent是一款基于AI技术的社交媒体内容管理工具,支持从URL内容自动生成Twitter和LinkedIn帖子。它提供人机交互流程,让用户能审核和调整生成内容。具备基础与高级模式,支持多种平台集成,如Slack和GitHub。适用于企业运营、个人品牌、营销推广及社区管理等多种场景,提升内容创作与发布效率。

ReasonIR

ReasonIR-8B 是由 Meta AI 开发的推理密集型检索模型,基于 LLaMA3.1-8B 训练,采用双编码器架构,提升复杂查询处理能力。结合合成数据生成工具,增强模型在长上下文和抽象问题中的表现。在多个基准测试中表现优异,适用于问答系统、教育、企业知识管理和科研等领域。

StableV2V

StableV2V是一款基于文本、草图和图片输入的开源视频编辑工具,利用Prompted First-frame Editor(PFE)、Iterative Shape Aligner(ISA)和Conditional Image-to-video Generator(CIG)三大模块,实现视频中物体的精准编辑与替换,同时保持编辑内容与原始视频在动作和深度信息上的高度一致性,适用于电影制作、教育、

SurveyX

SurveyX 是一款基于大型语言模型的学术综述生成工具,由多所高校联合开发。它通过用户输入的标题和关键词,自动生成高质量、结构化的学术综述,适用于多个研究领域。系统具备高效的文献检索与整合能力,结合智能大纲生成和内容优化技术,提升综述的准确性和逻辑性。同时支持动态更新和多模态展示,广泛应用于科研、教学及行业分析场景。

ACI.dev

ACI.dev 是一个开源 AI 基础设施平台,支持 600 多种预构建工具集成,涵盖主流应用如 Gmail、Slack 和 Notion。提供灵活的函数调用和 MCP 服务器访问方式,具备多租户认证、动态工具发现及自然语言权限管理功能。平台兼容多种 LLM 框架,支持多语言开发,具备监控与日志功能,适用于智能体开发与部署。

字幕说

字幕说是一款为自媒体创作者设计的在线工具,提供文字转语音、音文对齐、视频合成等功能。支持多语言发音、字幕翻译与优化,帮助用户高效生成高质量视频内容,无需出镜即可完成制作,提升创作效率。