AI

Higgsfield AI

一种基础视频模型,Higgsfield AI模型通过无与伦比的个性化和控制以及生成逼真的人类角色和动作的能力而脱颖而出。

Proxy Lite

Proxy Lite是一款开源的轻量级视觉语言模型,具有30亿参数,支持自动化网页操作。它通过“观察-思考-工具调用”机制,实现网页交互、数据抓取、表单填写等功能,适用于自动化测试、数据提取和智能任务辅助等场景。该工具资源占用低,可在消费级GPU上高效运行,适合开发者快速部署和使用。

Movie Gen

Movie Gen是Meta开发的一款AI视频生成与编辑工具,支持根据文本提示生成高清视频并提供同步音频配制。该工具具备强大的视频生成能力,可创建长达16秒的高清视频,并支持照片定制化视频生成和精准编辑功能。此外,它还拥有先进的音频生成技术,能够生成高质量的环境音效和背景音乐。当前,Movie Gen主要服务于Meta内部团队及部分合作伙伴,未来有望推广至更广泛的用户群体。 ---

FaceAiSwap

AI 换脸,一款允许用户与名人、朋友或其他任何人交换面孔。这用户友好的工具使用先进的人工智能技术将您的脸部无缝集成到任何图像中,提供了一种有趣且富有创意的方式,让您在不同的场景中重新想象自己。

WebAgent

WebAgent是阿里巴巴开源的自主搜索AI Agent,具备端到端的自主信息检索与多步推理能力。它能主动搜索多个学术数据库,筛选、分析最相关的文献,整合不同文献中的观点,为用户提供全面且精准的研究报告。WebAgent基于创新的数据合成方法和高效的训练策略,实现高效的多步推理和信息检索能力,适用于学术研究、商业决策和日常生活等多种场景。

灵境矩阵

灵境矩阵是百度最新推出的面向各类开发者的文心插件开发平台。

HoloTime

HoloTime 是由北京大学深圳研究生院与鹏城实验室联合开发的全景 4D 场景生成框架,可将单张全景图像转化为动态视频,并进一步重建为沉浸式 4D 场景。其核心技术包括全景动画生成器(Panoramic Animator)和时空重建技术,结合 360World 数据集进行训练,实现高质量的视频生成与场景重建。该工具支持 VR/AR 应用,适用于虚拟旅游、影视制作、游戏开发等多个领域,提供高效的沉

Pocket Flow

Pocket Flow 是一个极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。它具有轻量级、无依赖、无厂商锁定的特点,支持多 Agents、工作流、检索增强生成(RAG)等功能,帮助开发者快速构建基于 LLM 的应用程序。基于 Agentic Coding 范式,AI Agents 协助开发,提升效率。适用于多种编程语言,适合希望用极简方式开发 LLM 应用的开发者。

Liner

Liner是一个强大的AI工具,它通过集成到用户的工作环境中,提供了一系列功能,以提高工作效率和学习速度。