AI工具

Droidrun

Droidrun是一款基于AI的Android设备自动化工具,结合视觉识别、UI解析与LLM推理技术,支持自然语言控制和多平台部署。它能执行复杂任务自动化,具备自愈机制、多LLM兼容性及丰富的扩展接口,适用于AI助手、数据交互、测试验证等多种场景。

Poetry2Image

Poetry2Image是一个由哈尔滨工业大学提出的迭代校正框架,专门用于中文古诗词的图像生成。该工具通过自动化反馈和校正机制,提升了诗歌与图像的一致性,解决了文本到图像生成模型在处理中文古典诗歌时常见的关键元素丢失或语义混淆问题。Poetry2Image具备搜索翻译、生成初始图像、提取关键元素、图像修正及迭代优化等功能,与多种图像生成模型结合使用时,其元素完整性和语义一致性表现优异,适用于古诗词

Agent Laboratory

Agent Laboratory是由AMD与约翰·霍普金斯大学合作开发的基于大型语言模型的研究辅助工具,支持从文献综述到报告撰写的全流程科研任务。它具备实验设计、代码生成、结果分析等功能,并通过多代理协作和用户反馈机制提升研究质量。实验表明其可显著降低研究成本,适用于机器学习、生物医学等多个领域。

Bild AI

Bild AI 是一款面向建筑行业的智能工具,利用人工智能技术解析建筑图纸,自动生成材料清单与成本估算,并检测图纸是否符合建筑规范。它具备蓝图一致性验证、材料统计、合规性审查及智能修正建议等功能,适用于建筑设计、招投标、施工准备及许可证申请等多个环节,提升项目前期工作的效率与准确性。

FlexiAct

FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型,可在空间结构差异较大的场景下实现精准动作迁移,并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取(FAE),有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域,具有良好的应用前景。

字狐AI

字狐AI是一款集成多种AI功能的浏览器插件,主要功能包括智能问答、网页信息提取、写作辅助、PDF转换及OCR文字识别。用户可通过语音或文字与之互动,快速获取所需信息并提升工作效率。支持多语言识别与编辑,适用于办公文档处理、写作创作、资料阅读及PPT制作等场景。

天谱乐

天谱乐是一款由趣丸科技推出的支持多模态输入的音乐生成工具,涵盖文本、图片及视频生成音乐功能。它能够准确理解音乐复杂特性并生成高契合度配乐,同时提供专家模式和音乐编辑功能,适用于音乐创作、短视频配乐、影视配乐及个人娱乐等多个领域。

CountAnything

CountAnything是一款结合计算机视觉技术的计数工具,用户可通过拍照或上传图片标注样本,实现物品的自动计数。其功能涵盖工业、农业、物流及建筑等多个应用场景,支持历史数据保存、结果定制等功能,帮助用户提升工作效率与准确性。

APB

APB是一种由清华大学等机构开发的分布式长上下文推理框架,通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block,结合查询感知的上下文压缩技术,减少计算开销并精准传递关键信息。在128K长度文本上,APB推理速度比Flash Attention快10倍,比Star Attention快1.6倍,适用于多种分布式环境和模型规模,广泛

o3

o3-pro 是 OpenAI 开发的高级推理模型,继承并优化了 o3 的功能,在复杂问题解决和精确答案提供上表现出色。它集成了 ChatGPT 的多种工具,如网页搜索、文件分析、图像推理和编程等,适合科学研究、编程、教育和写作等领域。尽管响应速度稍慢,但在表达清晰度、逻辑准确性和答案完整性方面表现优异,并在数学、科学和编程等领域的性能上超越了前代模型。