锈点导航 - 软件、独立产品与实用工具导航

按标签筛选实时

每日更新订阅

每天上午 10 点，把当天新审核通过的导航项目发送到你的登录邮箱。

登录后即可订阅，适合持续发现新工具和独立产品。

用 Three.js 撸了一个 3D 地球 + 全球实时电台，性能有点炸，求优化建议

**产品主要功能描述**： 1. **3D交互式地球**：用户可以通过旋转和缩放来查看全球的3D地球模型。 2. **全球实时电台**：地球上的每个绿点代表一个真实在线的网络广播电台，如Shoutcast或Icecast。 3. **音频播放与控制**：用户可以点击地球上的任意点来播放、暂停或切换到该地区的广播。 **技术栈描述**： * Three.js：用于创建3D地球模型、标注点和光晕效果。 * Web Audio API：用于播放音频流、控制音量和处理跨域问题。 * 自建数据层：收集并存储全球约8000多个公开电台的数据。 * 前端框架：使用Vue和Vite构建用户界面。 * 坐标转换：将地理坐标转换为三维空间向量以便在地球上显示。 **遇到的问题及建议**： 1. **性能问题**：大量静态点加上少数动态高亮点导致低端设备帧率下降。建议探索“大量静态点 + 少数动态高亮点”场景的最佳实践。 2. **音频流的CORS和混合内容问题**：由于音频流是HTTP的，而网站是HTTPS，浏览器会阻止它。建议使用更轻量的CORS代理方案或自行搭建代理服务器，并估算相关成本。 3. **数据更新问题**：电台经常失效，需要半手工检测和脚本定期运行。建议寻找更稳定的全球公开电台API来减轻维护负担。 **未来计划添加的功能**： * 用户自定义导入电台：允许用户粘贴流地址并自动推算经纬度。 * “随机漫游”模式：每30秒自动跳转到另一个随机电台。 * 录音片段分享：允许用户录制15秒广播并生成分享链接。 **请求协助的事项**： * 在不同设备上测试网站性能，特别是手机和老笔记本。 * 如果知道本地或小众地区的网络电台流地址，请提供相关信息以便批量添加。 * 对于上述技术问题，希望得到有经验的网友的帮助和建议。

3D地球实时电台 Web开发性能优化音频播放数据处理

1个月前0024

ZenMark-实时渲染 Markdown 编辑器

产品：ZenMark 主要功能：实时渲染风格的 Markdown 工具描述：开源一个类似 Typora 的实时渲染风格的 Markdown 工具，是 AICoding 的成果。

开源 Markdown编辑器实时渲染 AICoding 工具

1个月前0014

实时数字人开源项目-让开发者轻松部署实时对话数字人

产品主要功能与描述： 1. 实时数字人本地部署：允许普通开发者较容易地在本地部署实时对话数字人。 2. 完整链路跑通：包括语音识别（ASR）、文本到语音（TTS）、大型语言模型（LLM）以及数字人视频生成。 3. WebUI交互：提供用户友好的Web界面进行交互。 4. 低延迟实时对话：实现快速响应的实时对话功能。 5. 多方案接入与对比：支持MuseTalk/FlashTalk等不同方案的接入，并提供效果对比。 6. 持续优化与改进：不断进行部署体验、推理效果方面的改进，如Windows用户一键启动、本地显卡部署等。 7. 开放与可学习性：打造开放、适合开发者学习和二次开发的项目，降低数字人平台的使用门槛。

实时数字人开源项目本地部署多语言支持实时对话 AI技术

1个月前0018

OpenTalking-实时数字人对话框架

**产品名称**：OpenTalking **主要功能**： 1. **实时对话数字人产线**：OpenTalking旨在将多个技术模块（如LLM、TTS、STT、WebRTC、字幕事件、角色音色、用户打断、前端交互和数字人视频驱动模型）串联起来，使数字人能够进行实时对话。 2. **状态管理和事件同步**：处理数字人演示与产品之间的工程距离，确保各个环节（如语音识别、文本生成、音频驱动、视频播放等）能够高效协同工作。 3. **多种部署模式**：提供Mock模式用于快速验证整体流程，Local模式支持单机部署，OmniRT模式便于接入远端推理服务，Direct WebSocket模式则方便开发者对接自己的模型服务。 4. **前端交互配置**：允许开发者配置数字人角色、音色、LLM、TTS、STT以及数字人驱动模型，并查看模型连接状态。 5. **后端事件编排**：负责编排对话中的各种事件，包括用户输入、模型回复、语音合成、字幕生成、视频播放和打断控制。 6. **支持多种模型后端**：目前已包含WebUI前端、后端API、会话编排、多种模型后端模式、角色配置、字幕事件和基础的实时对话链路。 **描述**： OpenTalking是一个为实时数字人设计的开源框架，它不仅涉及简单的图像移动或音频驱动口型，而是致力于创建一个能够进行连续对话、易于部署和切换模型的系统。该框架通过整合多个关键技术模块，简化了数字人开发的复杂性，并提供了灵活的部署选项，以适应不同的开发需求和资源条件。随着LLM、TTS和STT技术的日益成熟，OpenTalking有望在AI新闻主播、在线客服、教育讲解等多个领域发挥重要作用。

实时数字人开源免费实时对话数字人产线工程框架 LLM TTS WebRTC

2个月前0022

AI音频降噪在线工具-浏览器本地运行零上传音频解码，支持视频提取降噪，实时麦克风降噪，直观展示声谱图与波形图，无额度限制，打开即用。

产品主要功能：AI音频降噪在线工具 1. 支持MP3/WAV音频和视频的降噪处理。 2. 视频直接提取降噪，可拖入MP4/MOV等视频格式。 3. 实时麦克风降噪。 4. 提供Original/Denoised双通道声谱图与波形图，直观展示降噪效果。 5. 无需注册，100%浏览器本地运行，零上传。

AI音频处理工具在线工具实时降噪工具音频解码工具视频降噪工具声谱图工具

2个月前0022

开源数字人Agent框架-CyberVerse-打造专属数字分身与实时视频聊天

产品主要功能：开源数字人Agent框架，支持实时视频通话，创建数字分身，指挥数字分身做事。产品描述：CyberVerse是一个开源的实时数字人Agent框架，通过openClaw和豆包的技术，用户可以通过一张照片与任何喜欢的角色进行实时视频聊天，甚至创建自己的数字分身并指挥它帮忙做事。其愿景是构建一个由数字分身Agent组成的网络，可能类似于电影《头号玩家》中的绿洲或扎克伯格梦寐以求的MetaVerse。

开源数字人 Agent框架实时视频通话开源项目社交媒体

2个月前0019

Vibe Coding Markdown 编辑器-实时渲染、多模式编辑、便捷操作

产品主要功能：提供一个web端的实时渲染markdown编辑器。描述：该编辑器模仿了typora的实时渲染风格，用户可以在三种模式下进行操作，包括源码模式方便复制和修改、编辑模式类似typora实时渲染以及只读模式方便鼠标操作。编辑状态下，光标所在的行会变成编辑态。使用浏览器的存储，不与后端交互，数据不持久存储。用户可以新增文件或将已有文件拖拽进去。支持快捷键切换模式和下载到本地，以及隐藏左侧文件目录。

web应用 Markdown编辑器实时渲染源码模式编辑模式只读模式

2个月前0012

别只盯着 Sora 了， Google 刚出的 Gemini Omni 视频模型实测超预期，分享几个 Demo

Gemini Omni视频模型-高效生成UI界面文字，提升产品Demo和短视频广告效率

产品名称：Gemini Omni 视频模型主要功能： 1. 精准还原UI界面文字。 2. 快速响应指令，几秒钟内出预览效果。 3. 人物动作连续性好，不会出现多出一条腿的情况。 4. 生成的视频具有实用性，工程感强。描述：Gemini Omni 视频模型是Google推出的一款新型视频模型，试玩后认为它在理解和还原文字方面表现优异，适合产品Demo或短视频广告使用，能够提高工作效率。

视频模型效率工具演示工具工程应用实时渲染实用工具

2个月前0021

Spacebar Clicker-无限模式与计时模式游戏，全球排名竞技，简单易上手

产品名称：Spacebar Clicker 主要功能与描述： 1. **无限模式**： - 手动派：通过点数购买点击倍率，实现点击倍率的增加。 - 挂机派：购买自动产线，实现自动化的点击速度提升。 2. **计时模式**： - 提供纯比手速的计时模式，包括30秒、1分钟、3分钟和5分钟四个档次，考验玩家的耐力和速度。 3. **全球排名**： - 支持全球排名，玩家可以查看自己在不同模式下的排名情况。 - 匿名上榜，无需注册，方便玩家参与。 - 自定义修改昵称，支持跨设备使用，只需记住身份唯一ID即可。 - 排名几乎实时刷新，让玩家看到自己的排名不断提升。 4. **游戏特点**： - 拼手速，按空格决定一切，无需思考。 - 分数从K飙到M飙到B飙到T，肾上腺素飙升的感觉。 5. **获取方式**： - 通过提供的链接直达游戏地址：[Spacebar Clicker](https://whatgamesplay.com/zh/spacebar-clicker)

游戏点击游戏休闲游戏上瘾游戏实时排名社交游戏

2个月前0029

AI乒乓球记分助手-实时同步比分，便捷记分与观赛

产品主要功能和描述： * **乒乓球记分工具**：支持实时比分同步的乒乓球比赛记分工具。 * **用户角色**： + **记分员**：负责操作计分，并可通过设置赛制、分制和先发方来配置比赛；还可以通过上下滑动选手区域来加分或扣分；分享房间号给对手或观众以供他们查看比分。 + **观众**：可以通过分享链接或手动输入房间号来实时查看比赛比分、局数和发球方；还可以再次分享链接邀请更多人观看；如有需要，也可以记录比赛。 * **界面设计**：界面简洁，突出比分与大比分，其他元素不吸引视线。 * **功能操作**： + 加分：通过上下滑动选手区域实现。 + 扣分：长按选手区域实现（但原文中未提及此功能，可能是描述不完整或存在差异）。 + 设置赛制：点击右下角“⚙”按钮实现。 + 分享房间：点击左下角“🔗”按钮实现。 + 交换场地：点击“交换场地”按钮实现（但原文中未提及此功能，可能是描述不完整或存在差异）。 + 重新开始：点击“重新开始”按钮实现。 * **特色功能**：解决了手机记分时观众不方便观看的问题，通过朋友的手机同步比分展示给打球的朋友看。注意：原文中提到的“长按选手区域”来扣分功能，在描述中并未直接提及，可能是描述不完整或有出入，因此在上述回答中未包含此功能。

AI工具乒乓球记分工具实时比分无广告分享功能简单易用

2个月前0029

Soulx开源模型，数字人视频通话

产品主要功能：与数字人进行实时视频通话。产品描述：依托于Soulx开源模型的优秀性能，现在用户可以使用该产品与数字人进行实时视频通话。

AI工具视频通话开源实时数字人开发研究

3个月前0046

远程vibe工具

产品主要功能描述： 1. **远程Vibe工具**：一款名为MindFS的工具，支持多Agent会话。 2. **多Agent支持**：能够自动探测并使用已安装的多种Agent，如Claude Code、OpenAI Codex等。 3. **实时流式输出**：提供结构化卡片的实时渲染，展示工具调用、思考过程和权限请求。 4. **灵活切换**：在会话中可以随时切换Agent或模型，且多Agent共享同一上下文。 5. **会话搜索**：支持按会话标题或对话内容进行搜索，并能跳转到相关会话和片段。 6. **外部会话双向导入**：可导入受支持的Agent CLI的已有会话，并在MindFS中继续使用。 7. **绑定持久化与恢复**：会话信息与底层Agent会话绑定，并能在服务重启后恢复。 8. **富媒体输入**：支持在消息中直接附带文件和图片。 9. **多端同步**：同一实例可在多个设备上访问，会话状态实时同步。 10. **多Project管理**：同时托管多个目录，互不干扰。 11. **数据自托管**：所有对话历史、文件元数据和视图配置存储在项目目录的特定子目录下。 12. **文件树浏览**：提供完整的目录树导航和文件预览功能。 13. **交互优化**：包括`/`斜杠命令、`@`文件引用、`#`快捷提示词等，提升交互体验。 14. **访问模式**：包括本地模式、Relay远程模式和私有通道，满足不同访问需求。 15. **插件系统**：支持定制视图、Agent生成插件和交互闭环。 16. **安装运行**：生产构建为静态编译的单二进制文件，零依赖，多平台支持。

远程工具实时流式输出多端同步文件访问插件系统安装运行

3个月前0044

DuRT DuRT Website DuRT App Store

产品主要功能和描述： - 实时识别语音并转成文本，支持几十种语言 - 实时翻译识别后的文本成其他语言，支持几十种语言 - 实时校正识别后的文本，如增加标点符号，修改语法错误等 - 保存音频、文本及处理结果 - 使用大模型实现文本处理，可自定义提示词以优化效果 - 支持两种语音识别方式：系统内置和Whisper模型，均在本地运行 - 内置最小whisper模型，可下载更多规格 - 支持本地运行大模型和使用大模型API，推荐使用API以获取免费额度 - 运行要求：Mac系统版本13.0以上，芯片为M系列应用场景： - 看无字幕视频或直播 - 上网课、会议等保存录音和文本 - 学习外语时翻译视频或直播 - 看无法下载的视频额外信息： - 送码活动：30个月度会员+10个年度会员+2个永久会员，参与方式为回复，截止日期2025-2-22 23:59:59 - 抽奖方式：类似V2EX抽奖工具，需提供个人主页截图 - 联系邮箱：[email protected] - QQ群：![QQ群图片](https://durt.dudufuture.top/img/qq-group.jpg) - 联系方式：[官网文档](https://durt.dudufuture.top/docs/contact-us)

实时语音识别实时翻译文本校正多语言支持开发工具语言学习

1年前00426

AI群聊应用，V2版，开源，cloudflare部署，支持多AI角色对话，实时流式响应，自定义AI角色，禁言功能，Markdown格式，数学公式显示，响应式设计，移动端支持。

产品主要功能和描述： 1. 支持多个AI角色同时对话 2. 实时流式响应 3. 可自定义AI角色和个性 4. AI角色禁言功能 5. 支持Markdown格式 6. 支持数学公式显示（KaTeX） 7. 响应式设计，支持移动端

AI工具群聊应用开源云计算多角色对话实时响应

1年前00406

LM Speed 大语言模型速度测试评测平台

产品主要功能和描述： 1. **标准化性能评测**：提供客观、可量化的评估依据，降低技术选型风险。 2. **实时性能监控**：采用先进技术，全面展现API的性能特征和稳定性指标。 3. **数据分析与沉淀**：提供完整的性能数据管理解决方案，包括自动化测试报告生成、多维度性能指标整合等。 4. **自定义端点支持**：提供灵活的API端点配置选项，满足实际需求。 5. **实时流式结果**：实现实时流式结果展示，提供直观的测试体验。 6. **数据驱动的决策支持**：通过全方位的性能数据分析，提供实时性能洞察、全维度评估体系和可视化决策支持。

AI工具性能评测工具开发工具大语言模型 API性能分析实时监控

1年前00384

- Jade - Obsidian - Jade Publisher

**产品主要功能与描述：** 1. **支持Obsidian风格Markdown语法**：主要特点是支持wikilink功能。 2. **配合Obsidian插件[JadePublisher](https://github.com/LucasJi/jade-publisher)实现实时发布功能**。 3. **支持多平台浏览**：可以在手机、PC或平板上浏览笔记。

Next.js Obsidian 实时发布前端开发项目经验开发挑战

1年前00352

开源 Rust 实时语音转录翻译软件

产品主要功能：实时语音转录翻译软件，支持英文播客和英文会议翻译。描述：使用 Rust 编写，纯本地程序，可挂在桌面显示实时翻译的歌词。目前仅支持 macOS，Windows 用户可提 issue 请求支持。开源，GitHub 仓库欢迎 star。

开源语音转录翻译实时翻译开发工具 macOS 开源项目

1年前00367

Docker 管理工具Dockerman、Tauri、Rust

产品主要功能：Docker 管理工具 Dockerman 提供了集成终端、进程列表、容器列表、镜像信息、容器 Inspect、容器统计和日志查看等功能。产品描述：Dockerman 是一个现代化的 Docker 管理工具，基于 Tauri 和 Rust 开发，专注于提供轻量级和高性能的容器管理体验。它具有极速启动、跨平台支持、本地运行安全可靠、实时监控数据和直观界面等特点。用户可以通过 Dockerman 管理 Docker 容器和相关资源。

Docker管理工具容器管理跨平台支持实时监控资源占用低安全可靠

1年前00346

产品名称：Pinch

产品主要功能：基于AI语音和视频生成技术的沉浸式翻译视频会议平台。描述：Pinch允许不同国家的人无需通过字幕进行跨语言交流，支持20多种语言。它提供了一个云端的语音翻译agent，通过AI语音工作栈实现低延迟的跨语言翻译和TTS合成，确保接收端能在1-3秒内听到或看到翻译后的音视频。用户可以通过官网免费公测，体验单人demo、创建多人会议，并分享链接给朋友。

AI工具视频会议平台沉浸式翻译实时沟通跨语言创业孵化

1年前00317

Three.js 3D地球与全球实时电台-互动体验与技术交流平台

3D地球实时电台 Web开发性能优化音频播放数据处理

1个月前0024

实时数字人开源项目-让开发者轻松部署实时对话数字人

实时数字人开源项目本地部署多语言支持实时对话 AI技术

1个月前0018

AI音频降噪在线工具-浏览器本地运行零上传音频解码，支持视频提取降噪，实时麦克风降噪，直观展示声谱图与波形图，无额度限制，打开即用。

AI音频处理工具在线工具实时降噪工具音频解码工具视频降噪工具声谱图工具

2个月前0022

Vibe Coding Markdown 编辑器-实时渲染、多模式编辑、便捷操作