实时

知闻AI

一个基于AI的新闻聚合平台,只要为用户提供经过筛选和整理的高质量新闻内容,知闻AI通过分析大量新闻源,过滤掉低质量或不可信的信息,确保用户获取到的是准确、及时的新闻。

Bolt3D

Bolt3D是由谷歌研究院、牛津大学VGG团队与谷歌DeepMind联合开发的3D场景生成技术,基于潜在扩散模型,能在单块GPU上仅需6.25秒生成高质量3D场景。支持多视角输入,具备良好泛化能力,采用高斯溅射技术实现高保真表示,并支持实时交互。适用于游戏开发、VR/AR、建筑设计和影视制作等领域。

StockGPT

一款AI驱动的搜索工具,包含所有标准普尔 500 指数和纳斯达克公司的收益发布、财务报告和其他基本信息的知识。它允许用户询问摘要、分析不同时间范围内的公司绩效、获得有关产品更新的具体答案等等。

photoeditor

PhotoEditor是一款基于人工智能技术的在线图片编辑工具,支持多种格式的照片编辑,具备智能对象移除、自动图像增强、人像修饰、图像放大和多样化编辑工具等功能。凭借其对像素和上下文的精准分析,能够生成自然且高质量的结果,适用于社交媒体内容创作、电子商务产品图片处理、旅游照片优化和个人相册整理等多种应用场景。 ---

Signs

Signs是由英伟达推出的AI手语学习平台,通过实时手势识别与3D虚拟教学,帮助用户精准掌握美式手语。平台支持用户上传视频,丰富学习资源,具备互动性与个性化反馈,适用于初学者及进阶学习者,同时为无障碍技术开发提供数据支持。

Ultravox

Ultravox 是一种多模态大型语言模型(LLM),能够直接处理文本和语音输入,无需额外的语音识别步骤。其核心技术包括多模态投影器,用于将音频数据转换为高维空间表示,显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习,适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

KuaiFormer

KuaiFormer是一款基于Transformer架构的检索框架,专为大规模内容推荐系统设计。它通过重新定义检索流程,将传统分数估计任务转换为“下一个动作预测”,从而实现高效的多兴趣提取和实时兴趣捕捉。KuaiFormer具备多兴趣查询Token、自适应序列压缩、稳定训练等核心技术,已在快手App的短视频推荐系统中广泛应用,显著提升了用户体验和平台效率。 ---

快转字幕

快转字幕,适用于为各种创作者提供字幕制作、学习资源、会议记录、字幕制作等场景,一键为您的视频生成精准的字幕。

录音识别王

录音识别王,支持录音实时转文字、视频转文字、智能配音及图片转文字等功能,高效精准的录音识别技术,智能提取音频中的文字,支持TXT、WORD等格式导出,适用于各种录音制作场景。

Whisper Input

Whisper Input 是一款开源语音输入工具,基于 Python 和 OpenAI Whisper 模型开发,支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本,具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。