AI项目与工具

GaussianAnything

GaussianAnything 是一款基于多模态输入的 3D 内容生成框架,支持点云、文本和图像等多种输入方式,能够生成高精度且可编辑的 3D 模型。其核心技术包括点云结构化潜空间和级联扩散模型,具备几何与纹理解耦特性,适用于游戏开发、影视制作、VR/AR、工业设计等多个场景。该工具在生成质量和一致性方面表现优异,为 3D 内容创作提供了高效解决方案。

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型,具有强大的图像与文本对齐能力。它支持多种语言输入,具备零样本分类、图像-文本检索等功能,并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体,适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构,具备良好的兼容性。

Poe AI新功能「Previews」

Poe AI是一个集成多个强大AI聊天机器人的平台,用户可以通过统一界面与多个AI聊天机器人互动,获得多样化的信息和解决方案。Poe AI的新功能“Previews”允许用户实时预览AI生成的Web应用,支持交互体验,简化编程和设计流程,提高开发效率。该功能支持多种类型的应用程序,包括游戏、文本编辑器、数据分析工具等。用户可以与多个AI聊天机器人进行对话,并且可以无缝切换,获取不同的解决方案或优化

Gemma 2

Gemma 2是一款由谷歌DeepMind开发的开源人工智能模型,提供90亿和270亿参数版本。它具有卓越的性能、高效的推理速度和广泛的硬件兼容性,适用于各种应用场景。Gemma 2不仅支持多种AI框架,还提供了丰富的资源和工具,以支持开发者和研究人员负责任地构建和部署AI。

字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费

豆包MarsCode是一款由字节跳动开发的免费AI编程工具,提供AI驱动的云端集成开发环境(IDE)和智能编程扩展。其主要功能包括代码补全、生成、优化、注释生成、代码解释和错误修复等。MarsCode支持云函数开发,集成API测试、存储和部署工具,并能自动生成JSON Schema。此外,MarsCode扩展支持多种编程语言和IDE,涵盖从代码编辑到单元测试生成的多个辅助功能,显著提升了编码效率和

NotesGPT

NotesGPT是一款开源的AI语音笔记工具,具备语音转录、自动总结及任务生成等功能,采用先进技术保障转录准确性与任务生成效率,支持多语言并适配多种使用场景,如会议记录、学术研究及个人备忘等。

HumanRig

HumanRig是由阿里巴巴团队研发的3D人形角色自动绑定系统,提供大规模高质量数据集和先进算法,支持从粗到细的骨架估计与蒙皮优化。其核心组件包括先验引导骨架估计器(PGSE)和网格-骨架互注意网络(MSMAN),适用于游戏开发、影视制作、VR/AR及数字人应用,有效提升3D角色动画制作效率和质量。

CopyWeb

CopyWeb 是一款 AI 驱动的网页克隆与代码生成工具,支持通过 URL、截图或 Figma 导入设计,生成响应式 HTML/CSS 代码并导出为 React、Vue 等前端框架。内置智能组件识别和代码优化功能,提升开发效率,适用于原型开发、响应式设计验证及教学演示等场景。

33字幕

33字幕是一款集语音识别与文本翻译于一体的AI字幕生成工具,支持多种语言的语音转文字及翻译,可实现实时字幕生成与同步翻译。用户可通过本地AI模型免费运行,显著降低使用成本。该工具具备边识别边生成字幕、台词搜索等功能,广泛应用于视频创作、教育培训、企业会议等领域。

Napkins.dev

Napkins.dev 是一款基于 AI 技术的开源工具,能够将用户上传的截图或线框图快速转化为可运行的网页应用程序。它利用 Meta 的 Llama 系列模型和 Together.ai 的推理服务,支持代码生成、编辑和定制,并具备多主题选择及版本管理功能,适用于快速原型开发、教育学习、初创公司以及 UI/UX 设计验证等场景。