产品主要功能:MobileGym是一个安卓系统,它使用TypeScript和React编写,可以在浏览器中运行,并且集成了28个仿真APP,包括微信、支付宝、小红书、bilibili、X、Reddit、微信读书、12306、腾讯会议、Spotify、eBay等,还包括桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 产品描述:MobileGym最初是为了研究GUI Agent而开发的,但它也是一个开放的平台,用户可以在这里进行研究或进行其他开发工作。它兼容小米主题包并支持自定义小组件,Activity栈、Intent、手势返回、键盘适配等Android系统机制都在浏览器中被重写。此外,它具有超轻量、高并发的特点,单实例内存仅400M,服务器可支持成百上千个环境实例并行。提供了416个任务模板,可以参数化生成无限个任务实例,实现确定性评测,毫秒级出结果。Sim-to-Real实测有效,仿真环境中用GRPO强化学习训练的模型实测收益迁移到真机高达95%以上。扩展友好,文档齐全,新增应用和任务简单快捷。纯沙盒模式,无后果,不连接真实服务、不涉及真实资金、不发送真实消息,用户可以放心操作。
![[开源自荐] 烧了几百亿 token,我写了一个能在浏览器运行的安卓系统](/_next/image?url=https%3A%2F%2Fstatic.rustpoint.com%2Fscreenshots%2F1216344.jpg&w=3840&q=85)
mcp-dbutils是一款数据库访问服务,支持PostgreSQL和SQLite多种数据库类型。它通过抽象层设计,为MCP服务器提供简单、统一的数据库操作接口。

产品:light-chaser 数据可视化工具 主要功能与描述: 1. 个人开发的数据可视化工具。 2. 发布桌面端版本。 3. 推出 Pro 版。 4. 利用 AI 推出桌面端。 5. 项目持续打磨中。 6. 鼓励对此类方向有兴趣的人交流和提供反馈。 7. 桌面端完全免费。 8. 提供下载体验链接。

产品名称:Gemini Omni 视频模型 主要功能: 1. 精准还原UI界面文字。 2. 快速响应指令,几秒钟内出预览效果。 3. 人物动作连续性好,不会出现多出一条腿的情况。 4. 生成的视频具有实用性,工程感强。 描述:Gemini Omni 视频模型是Google推出的一款新型视频模型,试玩后认为它在理解和还原文字方面表现优异,适合产品Demo或短视频广告使用,能够提高工作效率。

产品主要功能:PasteMemo 是一款 AI Agent 搭配剪贴板的高级用法应用,内置了 MCP server,能让 Claude Code、Cursor、Codex 等 AI Agent 直接读写用户的剪贴板历史。 主要描述: - 允许 AI Agent 直接读取和写入剪贴板历史。 - 提供多种便捷功能,如查询最后复制的内容、生成文本放入剪贴板等。 - 支持一键集成,适用于已安装 Claude Code、Cursor 或 Codex 的用户。 - 底层基于标准 MCP(Model Context Protocol),兼容任何 MCP 客户端。 - 提供实际用法示例,如查询复制内容、生成 JSON 文件等。 - 可设置是否读取敏感剪贴项或添加特定 App 到黑名单。 - 提供下载链接和更新说明,Beta 版可直接访问,正式版需等待更新。
产品名称:配料识别宝 主要功能: 1. 配料识别:用户可以通过上传食材照片,系统利用AI技术识别出食材名称和重量,并提供相应的烹饪建议或信息。 描述: “配料识别宝”是一个基于AI技术的应用程序,其主要功能是识别和解析食材信息。用户只需上传食材的照片,系统便能通过深度学习算法识别出食材的名称、重量以及可能的烹饪用途。该应用依赖于一个名为“cursor”的后台服务,它负责处理图像识别任务并将结果转换为可读的文本格式。开发过程中,开发者针对样式问题进行了调整,以确保AI对样式的理解与用户一致。此外,原本计划收集所有配料数据进行处理的计划被搁置,因为考虑到国标和国际标准的配料数量,决定简化处理流程,仅使用正确的提问即可获得丰富的知识库。目前,该产品正在计划更换界面,以适应体检报告分析的功能需求。

产品主要功能:为小电影添加字幕。 描述:使用AI技术制作的一个工具,原本仅在v站发布,后因需求强烈而在其他平台被提及。五一期间进行了完善。