Gemini Live Gemini Live是一款由谷歌开发的智能语音助手,拥有自然语言理解和多模态识别能力,支持语音、图像和视频交互。其主要功能包括自然语言对话、多模态识别、个性化语音选择、任务自动化以及智能打断和续接。此外,Gemini Live还与谷歌的原生应用深度集成,提升用户体验。目标用户包括商务人士、技术探索者、多语言用户、创意人士和老年人。 AI项目与工具 2025年06月12日 13 点赞 0 评论 615 浏览
Gemini Robotics Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统,融合视觉-语言-动作模型,支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力,适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练,结合真实操作与多模态信息,实现高效、灵活的机器人控制。 AI项目与工具 2025年06月12日 17 点赞 0 评论 614 浏览
Stagehand Stagehand 是一款基于自然语言处理的 AI 工具,专注于网页自动化操作。其核心功能包括自然语言驱动的 `act`、`extract` 和 `observe` API,支持原子化指令执行和多模型适配。Stagehand 可实现网页测试、数据抓取、表单操作及内容监控等多样化任务,广泛应用于网页测试、数据分析、办公自动化等领域。 AI项目与工具 2025年06月12日 51 点赞 0 评论 614 浏览
AndroidGen AndroidGen 是一个基于大语言模型(LLM)的智能代理框架,专注于提升 Agent 在数据稀缺环境下的任务执行能力。它通过无监督方式收集用户操作轨迹并进行训练,结合 ExpSearch、ReflectPlan、AutoCheck 和 StepCritic 四个核心模块,增强任务规划、执行和评估能力。该框架在 AndroidWorld 和 AitW 基准测试中表现出色,适用于自动化任务处理、 AI项目与工具 2025年06月12日 31 点赞 0 评论 613 浏览
Translate Image Translate Image 是一款基于 AI 技术的图片翻译工具,支持多语言翻译、上下文感知、技术术语识别等功能。可处理产品图片、电商列表、漫画、照片等,适用于电商、社交媒体和文档处理等多种场景。支持多种图片格式,提供智能文字移除与文本保护功能,翻译准确率高,操作便捷。 AI项目与工具 2025年06月12日 74 点赞 0 评论 612 浏览
WebDesignAgent WebDesignAgent是一款基于AI技术的自动化网页设计工具,支持文本到网站、图像到网站等多种输入方式,可生成功能齐全、设计精美的网页。它支持多页面设计、用户自定义及迭代优化,适用于个人博客、企业官网、电商页面等多种场景。通过集成自然语言处理、计算机视觉以及大型语言模型,WebDesignAgent能够智能化地完成从内容理解到网页生成的全过程。 AI项目与工具 2025年06月12日 85 点赞 0 评论 610 浏览
Metaview Metaview是一款利用人工智能技术的面试摘要工具,可自动记录和整理面试内容,生成结构化摘要,帮助招聘团队高效处理候选人信息。其核心功能包括关键信息提取、模板定制、数据安全保护以及与主流招聘系统的无缝集成,广泛应用于大规模招聘、远程面试和技术岗位筛选等场景。 AI项目与工具 2025年06月12日 46 点赞 0 评论 609 浏览
AutoAgent AutoAgent是香港大学开发的零代码LLM智能体框架,支持自然语言交互创建智能助手,适用于搜索、分析和报告生成等场景。提供三种使用模式和双交互模式,兼容多种LLM模型,具备自管理向量数据库和多代理协作能力,部署便捷,适合各类用户高效完成复杂任务。 AI项目与工具 2025年06月12日 68 点赞 0 评论 608 浏览
投资策略模拟器 一种帮助投资者通过模拟环境来测试和优化他们的投资策略的工具,投资策略模拟器利用历史数据、市场模型和高级计算技术,如神经网络、大数据分析和云计算,来模拟股票、期货、外汇等市场的行为。 财经投资 2025年06月05日 81 点赞 0 评论 608 浏览
秒哒 秒哒是一款由百度开发的零代码AI开发平台,基于大模型和智能体技术,支持多智能体协作和工具调用扩展。用户无需编程即可通过自然语言或图形化界面快速创建应用程序,实现创意落地。秒哒适用于企业自动化、教育、个人项目等多种场景,具有零代码编程、模块化构建、流程自动化等特点,大幅降低开发门槛并提升效率。 AI项目与工具 2025年03月25日 60 点赞 0 评论 608 浏览