**产品主要功能描述**:
1. **3D交互式地球**:用户可以通过旋转和缩放来查看全球的3D地球模型。
2. **全球实时电台**:地球上的每个绿点代表一个真实在线的网络广播电台,如Shoutcast或Icecast。
3. **音频播放与控制**:用户可以点击地球上的任意点来播放、暂停或切换到该地区的广播。
**技术栈描述**:
* Three.js:用于创建3D地球模型、标注点和光晕效果。
* Web Audio API:用于播放音频流、控制音量和处理跨域问题。
* 自建数据层:收集并存储全球约8000多个公开电台的数据。
* 前端框架:使用Vue和Vite构建用户界面。
* 坐标转换:将地理坐标转换为三维空间向量以便在地球上显示。
**遇到的问题及建议**:
1. **性能问题**:大量静态点加上少数动态高亮点导致低端设备帧率下降。建议探索“大量静态点 + 少数动态高亮点”场景的最佳实践。
2. **音频流的CORS和混合内容问题**:由于音频流是HTTP的,而网站是HTTPS,浏览器会阻止它。建议使用更轻量的CORS代理方案或自行搭建代理服务器,并估算相关成本。
3. **数据更新问题**:电台经常失效,需要半手工检测和脚本定期运行。建议寻找更稳定的全球公开电台API来减轻维护负担。
**未来计划添加的功能**:
* 用户自定义导入电台:允许用户粘贴流地址并自动推算经纬度。
* “随机漫游”模式:每30秒自动跳转到另一个随机电台。
* 录音片段分享:允许用户录制15秒广播并生成分享链接。
**请求协助的事项**:
* 在不同设备上测试网站性能,特别是手机和老笔记本。
* 如果知道本地或小众地区的网络电台流地址,请提供相关信息以便批量添加。
* 对于上述技术问题,希望得到有经验的网友的帮助和建议。
产品:ZenMark
主要功能:实时渲染风格的 Markdown 工具
描述:开源一个类似 Typora 的实时渲染风格的 Markdown 工具,是 AICoding 的成果。
产品主要功能与描述:
1. 实时数字人本地部署:允许普通开发者较容易地在本地部署实时对话数字人。
2. 完整链路跑通:包括语音识别(ASR)、文本到语音(TTS)、大型语言模型(LLM)以及数字人视频生成。
3. WebUI交互:提供用户友好的Web界面进行交互。
4. 低延迟实时对话:实现快速响应的实时对话功能。
5. 多方案接入与对比:支持MuseTalk/FlashTalk等不同方案的接入,并提供效果对比。
6. 持续优化与改进:不断进行部署体验、推理效果方面的改进,如Windows用户一键启动、本地显卡部署等。
7. 开放与可学习性:打造开放、适合开发者学习和二次开发的项目,降低数字人平台的使用门槛。
**产品名称**:OpenTalking
**主要功能**:
1. **实时对话数字人产线**:OpenTalking旨在将多个技术模块(如LLM、TTS、STT、WebRTC、字幕事件、角色音色、用户打断、前端交互和数字人视频驱动模型)串联起来,使数字人能够进行实时对话。
2. **状态管理和事件同步**:处理数字人演示与产品之间的工程距离,确保各个环节(如语音识别、文本生成、音频驱动、视频播放等)能够高效协同工作。
3. **多种部署模式**:提供Mock模式用于快速验证整体流程,Local模式支持单机部署,OmniRT模式便于接入远端推理服务,Direct WebSocket模式则方便开发者对接自己的模型服务。
4. **前端交互配置**:允许开发者配置数字人角色、音色、LLM、TTS、STT以及数字人驱动模型,并查看模型连接状态。
5. **后端事件编排**:负责编排对话中的各种事件,包括用户输入、模型回复、语音合成、字幕生成、视频播放和打断控制。
6. **支持多种模型后端**:目前已包含WebUI前端、后端API、会话编排、多种模型后端模式、角色配置、字幕事件和基础的实时对话链路。
**描述**:
OpenTalking是一个为实时数字人设计的开源框架,它不仅涉及简单的图像移动或音频驱动口型,而是致力于创建一个能够进行连续对话、易于部署和切换模型的系统。该框架通过整合多个关键技术模块,简化了数字人开发的复杂性,并提供了灵活的部署选项,以适应不同的开发需求和资源条件。随着LLM、TTS和STT技术的日益成熟,OpenTalking有望在AI新闻主播、在线客服、教育讲解等多个领域发挥重要作用。
产品主要功能:AI音频降噪在线工具
1. 支持MP3/WAV音频和视频的降噪处理。
2. 视频直接提取降噪,可拖入MP4/MOV等视频格式。
3. 实时麦克风降噪。
4. 提供Original/Denoised双通道声谱图与波形图,直观展示降噪效果。
5. 无需注册,100%浏览器本地运行,零上传。
产品主要功能:开源数字人Agent框架,支持实时视频通话,创建数字分身,指挥数字分身做事。
产品描述:CyberVerse是一个开源的实时数字人Agent框架,通过openClaw和豆包的技术,用户可以通过一张照片与任何喜欢的角色进行实时视频聊天,甚至创建自己的数字分身并指挥它帮忙做事。其愿景是构建一个由数字分身Agent组成的网络,可能类似于电影《头号玩家》中的绿洲或扎克伯格梦寐以求的MetaVerse。
产品主要功能:提供一个web端的实时渲染markdown编辑器。
描述:该编辑器模仿了typora的实时渲染风格,用户可以在三种模式下进行操作,包括源码模式方便复制和修改、编辑模式类似typora实时渲染以及只读模式方便鼠标操作。编辑状态下,光标所在的行会变成编辑态。使用浏览器的存储,不与后端交互,数据不持久存储。用户可以新增文件或将已有文件拖拽进去。支持快捷键切换模式和下载到本地,以及隐藏左侧文件目录。
产品名称:Gemini Omni 视频模型
主要功能:
1. 精准还原UI界面文字。
2. 快速响应指令,几秒钟内出预览效果。
3. 人物动作连续性好,不会出现多出一条腿的情况。
4. 生成的视频具有实用性,工程感强。
描述:Gemini Omni 视频模型是Google推出的一款新型视频模型,试玩后认为它在理解和还原文字方面表现优异,适合产品Demo或短视频广告使用,能够提高工作效率。
产品名称:Spacebar Clicker
主要功能与描述:
1. **无限模式**:
- 手动派:通过点数购买点击倍率,实现点击倍率的增加。
- 挂机派:购买自动产线,实现自动化的点击速度提升。
2. **计时模式**:
- 提供纯比手速的计时模式,包括30秒、1分钟、3分钟和5分钟四个档次,考验玩家的耐力和速度。
3. **全球排名**:
- 支持全球排名,玩家可以查看自己在不同模式下的排名情况。
- 匿名上榜,无需注册,方便玩家参与。
- 自定义修改昵称,支持跨设备使用,只需记住身份唯一ID即可。
- 排名几乎实时刷新,让玩家看到自己的排名不断提升。
4. **游戏特点**:
- 拼手速,按空格决定一切,无需思考。
- 分数从K飙到M飙到B飙到T,肾上腺素飙升的感觉。
5. **获取方式**:
- 通过提供的链接直达游戏地址:[Spacebar Clicker](https://whatgamesplay.com/zh/spacebar-clicker)
产品主要功能和描述:
* **乒乓球记分工具**:支持实时比分同步的乒乓球比赛记分工具。
* **用户角色**:
+ **记分员**:负责操作计分,并可通过设置赛制、分制和先发方来配置比赛;还可以通过上下滑动选手区域来加分或扣分;分享房间号给对手或观众以供他们查看比分。
+ **观众**:可以通过分享链接或手动输入房间号来实时查看比赛比分、局数和发球方;还可以再次分享链接邀请更多人观看;如有需要,也可以记录比赛。
* **界面设计**:界面简洁,突出比分与大比分,其他元素不吸引视线。
* **功能操作**:
+ 加分:通过上下滑动选手区域实现。
+ 扣分:长按选手区域实现(但原文中未提及此功能,可能是描述不完整或存在差异)。
+ 设置赛制:点击右下角“⚙”按钮实现。
+ 分享房间:点击左下角“🔗”按钮实现。
+ 交换场地:点击“交换场地”按钮实现(但原文中未提及此功能,可能是描述不完整或存在差异)。
+ 重新开始:点击“重新开始”按钮实现。
* **特色功能**:解决了手机记分时观众不方便观看的问题,通过朋友的手机同步比分展示给打球的朋友看。
注意:原文中提到的“长按选手区域”来扣分功能,在描述中并未直接提及,可能是描述不完整或有出入,因此在上述回答中未包含此功能。
产品主要功能:与数字人进行实时视频通话。
产品描述:依托于Soulx开源模型的优秀性能,现在用户可以使用该产品与数字人进行实时视频通话。
产品主要功能描述:
1. **远程Vibe工具**:一款名为MindFS的工具,支持多Agent会话。
2. **多Agent支持**:能够自动探测并使用已安装的多种Agent,如Claude Code、OpenAI Codex等。
3. **实时流式输出**:提供结构化卡片的实时渲染,展示工具调用、思考过程和权限请求。
4. **灵活切换**:在会话中可以随时切换Agent或模型,且多Agent共享同一上下文。
5. **会话搜索**:支持按会话标题或对话内容进行搜索,并能跳转到相关会话和片段。
6. **外部会话双向导入**:可导入受支持的Agent CLI的已有会话,并在MindFS中继续使用。
7. **绑定持久化与恢复**:会话信息与底层Agent会话绑定,并能在服务重启后恢复。
8. **富媒体输入**:支持在消息中直接附带文件和图片。
9. **多端同步**:同一实例可在多个设备上访问,会话状态实时同步。
10. **多Project管理**:同时托管多个目录,互不干扰。
11. **数据自托管**:所有对话历史、文件元数据和视图配置存储在项目目录的特定子目录下。
12. **文件树浏览**:提供完整的目录树导航和文件预览功能。
13. **交互优化**:包括`/`斜杠命令、`@`文件引用、`#`快捷提示词等,提升交互体验。
14. **访问模式**:包括本地模式、Relay远程模式和私有通道,满足不同访问需求。
15. **插件系统**:支持定制视图、Agent生成插件和交互闭环。
16. **安装运行**:生产构建为静态编译的单二进制文件,零依赖,多平台支持。
产品主要功能和描述:
- 实时识别语音并转成文本,支持几十种语言
- 实时翻译识别后的文本成其他语言,支持几十种语言
- 实时校正识别后的文本,如增加标点符号,修改语法错误等
- 保存音频、文本及处理结果
- 使用大模型实现文本处理,可自定义提示词以优化效果
- 支持两种语音识别方式:系统内置和Whisper模型,均在本地运行
- 内置最小whisper模型,可下载更多规格
- 支持本地运行大模型和使用大模型API,推荐使用API以获取免费额度
- 运行要求:Mac系统版本13.0以上,芯片为M系列
应用场景:
- 看无字幕视频或直播
- 上网课、会议等保存录音和文本
- 学习外语时翻译视频或直播
- 看无法下载的视频
额外信息:
- 送码活动:30个月度会员+10个年度会员+2个永久会员,参与方式为回复,截止日期2025-2-22 23:59:59
- 抽奖方式:类似V2EX抽奖工具,需提供个人主页截图
- 联系邮箱:[email protected]
- QQ群:
- 联系方式:[官网文档](https://durt.dudufuture.top/docs/contact-us)
产品主要功能和描述:
1. 支持多个AI角色同时对话
2. 实时流式响应
3. 可自定义AI角色和个性
4. AI角色禁言功能
5. 支持Markdown格式
6. 支持数学公式显示(KaTeX)
7. 响应式设计,支持移动端
产品主要功能和描述:
1. **标准化性能评测**:提供客观、可量化的评估依据,降低技术选型风险。
2. **实时性能监控**:采用先进技术,全面展现API的性能特征和稳定性指标。
3. **数据分析与沉淀**:提供完整的性能数据管理解决方案,包括自动化测试报告生成、多维度性能指标整合等。
4. **自定义端点支持**:提供灵活的API端点配置选项,满足实际需求。
5. **实时流式结果**:实现实时流式结果展示,提供直观的测试体验。
6. **数据驱动的决策支持**:通过全方位的性能数据分析,提供实时性能洞察、全维度评估体系和可视化决策支持。
**产品主要功能与描述:**
1. **支持Obsidian风格Markdown语法**:主要特点是支持wikilink功能。
2. **配合Obsidian插件[JadePublisher](https://github.com/LucasJi/jade-publisher)实现实时发布功能**。
3. **支持多平台浏览**:可以在手机、PC或平板上浏览笔记。
产品主要功能:实时语音转录翻译软件,支持英文播客和英文会议翻译。
描述:使用 Rust 编写,纯本地程序,可挂在桌面显示实时翻译的歌词。目前仅支持 macOS,Windows 用户可提 issue 请求支持。开源,GitHub 仓库欢迎 star。
产品主要功能:Docker 管理工具 Dockerman 提供了集成终端、进程列表、容器列表、镜像信息、容器 Inspect、容器统计和日志查看等功能。
产品描述:Dockerman 是一个现代化的 Docker 管理工具,基于 Tauri 和 Rust 开发,专注于提供轻量级和高性能的容器管理体验。它具有极速启动、跨平台支持、本地运行安全可靠、实时监控数据和直观界面等特点。用户可以通过 Dockerman 管理 Docker 容器和相关资源。
产品主要功能:基于AI语音和视频生成技术的沉浸式翻译视频会议平台。
描述:Pinch允许不同国家的人无需通过字幕进行跨语言交流,支持20多种语言。它提供了一个云端的语音翻译agent,通过AI语音工作栈实现低延迟的跨语言翻译和TTS合成,确保接收端能在1-3秒内听到或看到翻译后的音视频。用户可以通过官网免费公测,体验单人demo、创建多人会议,并分享链接给朋友。