工具

百度AI同传

强大的实时同传工具,它通过百度的AI技术,为用户提供实时的语音识别和多语言翻译服务。这款工具不仅提高了跨语言交流的效率,还极大地方便了国际会议、商务洽谈等多语言环境中的...

Rope

Rope是一款基于深度学习的开源AI换脸工具,利用insightface的inswapper_128模型提供直观的图形界面,支持图片和视频换脸。它具备强大的遮罩功能和参数调节选项,支持超分辨率算法,广泛应用于影视制作、游戏开发、虚拟现实等领域。

Awesome LangGraph

一份精心整理的 LangGraph 资源合集,涵盖了基础介绍、入门模板、示例应用、实用工具等资源、以及整理一些如智能体、AI 助手、开发与工具、内容与媒体、知识与检索等优秀项目。

Firra流程图

一款由厦门无限飞科技有限公司独立自主研发的简洁、高效的在线流程图和思维导图设计工具,Firra能够帮助您快速实现各类创作需求。

SPDL

SPDL(Scalable and Performant Data Loading)是一款由Meta AI开发的开源工具,专注于提高AI模型训练效率。它通过多线程技术和异步事件循环实现高吞吐量数据加载,降低资源消耗,支持分布式系统和主流AI框架PyTorch,适用于大规模数据集及复杂任务。其主要特点包括高吞吐量、低资源占用、框架无关性、性能监控与调优能力以及分布式系统支持。

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学联合研发的零样本多粒度视频编辑框架,支持类别级、实例级和部件级的精细化视频修改。它通过调节时空交叉注意力和自注意力机制,提升文本提示对目标区域的控制能力,确保时间一致性与特征分离,显著优于现有T2I和T2V方法。该工具无需额外参数调整,具备高效计算性能,适用于影视制作、广告营销、内容创作等多个领域。

olmOCR

olmOCR 是一款开源 PDF 文档处理工具,结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型,可高效提取结构化文本并保留原始布局。支持多种文档类型,具备大规模批量处理能力和低成本优势,适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

maket

Maket是一款基于生成式AI技术的建筑设计工具,主要功能包括自动化生成楼层平面图、设计风格探索、设计元素定制等。它通过虚拟助手为用户提供材料、成本和设计方案的专业建议,同时简化法规遵守流程,确保项目合规性。此外,Maket支持快速生成概念设计并提供即时合规反馈,有效提升设计效率与质量。

Creatie.Ai

基于AI的UI/UX 设计工具,只需几分钟即可建立您自己的设计系统!Creatie.Ai的人工智能识别现有文件中的可重用组件,并生成全面的样式库,包括字体、颜色和阴影。

Mureka V6

Mureka V6是昆仑万维推出的AI音乐创作平台基座模型,支持多语言音乐生成及纯音乐创作。采用自研ICL技术,提升音乐结构连贯性与情感表达。用户可通过文本、音频或音色参考进行个性化创作,适用于多种音乐风格与情绪。支持从简单模式到高级模式的灵活操作,广泛应用于音乐爱好者、专业音乐人及内容创作等领域。