R

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架,允许用户通过文本提示生成包含多个事件的连贯视频,并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧,同时结合预训练的视频扩散变换器(DiT)和大型语言模型(LLM)的提示增强功能,进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域,为视频创作带来了创新性的解决方案。

Free Video

Free Video-LLM是一种无需训练的高效视频语言模型,基于提示引导的视觉感知技术,可直接对视频内容进行理解和推理,适用于视频问答、内容分析等多种场景。通过时空采样优化和减少视觉标记,它在保持高性能的同时显著降低了计算复杂度。

Flex3D

Flex3D是一款由Meta和牛津大学联合研发的两阶段3D生成框架,通过多视图扩散模型和视图筛选机制生成高质量3D模型,支持从文本、单张图片或稀疏视图生成逼真的3D内容。其核心在于基于Transformer架构的灵活重建模型(FlexRM),结合三平面表示与3D高斯绘制技术,实现高效且详细的三维重建,广泛应用于游戏开发、AR/VR、影视制作等领域。

PromptVibes

PromptVibes是一个大量有用的chatGPT提示的集合,用户可以窃取这些提示来成为chatGPT专家。它提供了各种类别的提示,如从ChatGPT学习,有趣的提示,专家ChatGPT,生产力,编码提示...

NextChat

NextChat 是一个基于 Next.js 和 Vercel 的开源项目,允许用户将 ChatGPT 等 AI 大模型集成到自己的网页应用中。该工具支持多平台部署,具备一键式部署功能,并提供完整的 Markdown 支持。NextChat 可用于个人助理、客户服务、教育辅导、内容创作和技术支持等多个领域。

GPTsApp.io

第三方GPTs商店,由 GPT-4 Turbo 和 Pinecone 提供支持,收录了超过60万的公共GPTs, 为用户提供GPTs排名,收藏, 评测等功能。

豆包MarsCode

豆包MarsCode是字节跳动旗下的公司推出的一个免费AI编程工具,既提供一个AI驱动的云端集成开发环境(IDE),也支持作为VS Code和JetBrains的智能编程扩展(Extension)使用。基于...

EmojiGen

EmojiGen是一个开源的表情符号生成器。用户只需要在输入框中输入一个词或短语,EmojiGen就会立即生成相关的表情符号。

WebWalker

WebWalker是阿里巴巴研发的AI工具,用于评估和优化大型语言模型在网页浏览任务中的表现。它通过多智能体框架、垂直探索策略及WebWalkerQA数据集,提升模型处理长上下文和多源信息的能力。支持多语言、多领域和多难度任务,适用于信息检索、数据分析和内容监控等场景,具备良好的适应性和可扩展性。

ChatPaper

ChatPaper是一款集检索、阅读、知识问答于一体的文献知识工具,专为科研人员设计,旨在提高检索和阅读论文的效率,快速获取最新领域研究动态。它利用ChatGPT3.5的API接口,能够根...