与只能处理单一模态的独立 AI 视频生成器不同,Gemini Omni 可以直接在聊天中生成、混剪、编辑和重写视频场景——无需切换工具。该平台提供最高 120fps 的原生 4K 分辨率输出、持久化的世界状态记忆以确保角色一致性、基于自然语言的对话式视频编辑,以及在单次扩散过程中集成的拟音与对白合成。
![[开源自荐] 烧了几百亿 token,我写了一个能在浏览器运行的安卓系统](/_next/image?url=https%3A%2F%2Fstatic.rustpoint.com%2Fscreenshots%2F1216344.jpg&w=3840&q=75)
产品主要功能:MobileGym是一个安卓系统,它使用TypeScript和React编写,可以在浏览器中运行,并且集成了28个仿真APP,包括微信、支付宝、小红书、bilibili、X、Reddit、微信读书、12306、腾讯会议、Spotify、eBay等,还包括桌面、设置、通讯录、短信、相册、日历、文件、浏览器等系统应用。 产品描述:MobileGym最初是为了研究GUI Agent而开发的,但它也是一个开放的平台,用户可以在这里进行研究或进行其他开发工作。它兼容小米主题包并支持自定义小组件,Activity栈、Intent、手势返回、键盘适配等Android系统机制都在浏览器中被重写。此外,它具有超轻量、高并发的特点,单实例内存仅400M,服务器可支持成百上千个环境实例并行。提供了416个任务模板,可以参数化生成无限个任务实例,实现确定性评测,毫秒级出结果。Sim-to-Real实测有效,仿真环境中用GRPO强化学习训练的模型实测收益迁移到真机高达95%以上。扩展友好,文档齐全,新增应用和任务简单快捷。纯沙盒模式,无后果,不连接真实服务、不涉及真实资金、不发送真实消息,用户可以放心操作。
主要功能:AI 生成图片网站,可使用多个模型如 flux.dev, recraft, idogram, kolors 等生成图片。 描述:该网站利用下班和周末时间开发,计划邀请内测用户体验并赠送 360 积分。预计将支持 midjourney 模型、upscale 和视频生成功能,目前正进行中。用户可通过发送 Google 邮箱账号获取邀请链接参与内测,V2EX 将邀请最多 50 名内测用户,并欢迎提供建议和反馈。

产品:Hambook 主要功能: 1. 支持 OMPL 格式 RSS 源文件导入 2. 支持单手流畅刷博客 3. 支持 DeepSeek-v3 对博客文章总结 补充信息: - 下载 Rss 源的网站:https://hambook.top(域名正在备案中,仅限 PC 端浏览器访问)
![[送码] iOS 平台用来管理 Clash 服务的 App: Clash Dash](/_next/image?url=https%3A%2F%2Fstatic.rustpoint.com%2Fscreenshots%2F1101519.jpg&w=3840&q=75)
产品:Clash Dash 主要功能: - Clash 控制器功能:切换节点、查看活动连接。 - 支持多种内核:OpenClash、原版内核、mihomo 内核、sing-box 内核。 - OpenClash 的部分功能:修改配置文件、切换配置文件、更新订阅、添加附加规则等。 描述:Clash Dash 是一个用于管理 Clash 服务的 iOS 应用。它提供了 Clash 控制器的全部功能,并支持多种内核。此外,它还具备 OpenClash 的部分功能,如修改配置文件、切换配置文件、更新订阅和添加附加规则等。该应用不提供科学上网能力,仅作为管理 Clash 服务的外部控制器。

产品主要功能与描述: * **音乐播放器风格**:采用Apple Music风格设计。 * **在线体验**:提供在线音乐播放服务,可通过链接访问。 * **源码开放**:提供项目源码,方便用户查看和修改。 * **免费无广告**:播放器功能免费,且不含广告。 * **多平台适配**:UI适配PC和移动端,可在不同设备上使用。 * **支持PWA安装**:可将播放器安装到桌面,方便离线听歌。 * **歌曲托管**:歌曲资源直接托管在GitHub上,稳定性相对较高。 * **二次开发支持**:项目包含`db.json`文件,供有兴趣的用户进行二次开发。 * **预览图**:附带预览图以展示播放器界面。

产品主要功能:copilot-agent-lite 是一个超轻量级的 AI Agent Runtime,它旨在解决多个项目需求,包括自动化的任务执行如项目检查、自动修复和提交 PR,同时无需繁重的 LangChain + Dapr 重栈。 描述:copilot-agent-lite 是为那些需要轻量、零依赖且能通过 cron 自动化的 AI Agent Runtime 的项目设计的。它解决了手动触发任务(如 Claude Code/Codex CLI 需要人工操作)以及 Copilot SDK 与 MCP server 集成路径文档缺失的问题,并且不需要容器化或外部 broker。该产品在 Free Github 和 Github Enterprise 上进行了测试并通过。