AriaType-语音转文字输入法

产品名称:AriaType 主要功能: 1. 支持上下文感知的语音转文字功能。 2. 使用SenseVoice模型提升中文和英文的识别准确率和速度,使用Whisper模型提升其他语言的识别速度。 3. 录制过程中根据激活窗口进行内容识别,提取高频词汇作为STT引擎和润色引擎的上下文信息。 4. 润色过程中根据用户工作上下文进行智能语法词汇纠正,提升准确率。 描述:AriaType是一个针对中文、英文和其他语言的语音转文字输入法客户端,它通过分析用户的语音输入并结合上下文信息,提供更准确的文字转换和润色服务。

开发了一个支持上下文感知的语音转文字的输入法客户端 AriaType, 希望能获得大家技术/产品上的一些建议
2026年5月12日
0
4

猜你喜欢

做了个剪贴板&截图增强工具

产品主要功能与描述: 1. 增强剪贴板功能,包括历史查看。 2. 增加截图功能,如按选区截图、应用窗口截图、截图标注、增加文字或马赛克、截图OCR以及截图钉在屏幕顶部。 3. 剪贴板和截图内容可直接发送到Wegent AI的待办收件箱。 4. Wegent里的待办收件箱得到强化,支持收件箱自动化功能,如转发内容给智能体或订阅器。 结合WeCut和Wegent,可实现以下功能: 1. 屏幕上出现的内容可直接发到Wegent作为AI提问素材。 2. 设置自动处理后,可直接对剪贴板或屏幕截图提问。 3. AI对剪贴板或屏幕截图的内容进行分析、补充、归类和处理,并在Wegent知识库中实现karpathy的llm-wiki流程。 4. 配置自动执行智能体,基于剪贴板或截图开始处理任务。 目前仅基本流程已跑通,后续会进行细节优化,欢迎试用。

开发工具效率工具

Cursor 半小时写好的小程序上架了

产品名称:配料识别宝 主要功能: 1. 配料识别:用户可以通过上传食材照片,系统利用AI技术识别出食材名称和重量,并提供相应的烹饪建议或信息。 描述: “配料识别宝”是一个基于AI技术的应用程序,其主要功能是识别和解析食材信息。用户只需上传食材的照片,系统便能通过深度学习算法识别出食材的名称、重量以及可能的烹饪用途。该应用依赖于一个名为“cursor”的后台服务,它负责处理图像识别任务并将结果转换为可读的文本格式。开发过程中,开发者针对样式问题进行了调整,以确保AI对样式的理解与用户一致。此外,原本计划收集所有配料数据进行处理的计划被搁置,因为考虑到国标和国际标准的配料数量,决定简化处理流程,仅使用正确的提问即可获得丰富的知识库。目前,该产品正在计划更换界面,以适应体检报告分析的功能需求。

产品类型:AI工具数据分析工具

开发了一个浏览器翻译插件,主要是翻译编辑框里的内容,欢迎大家来试试

产品主要功能:翻译编辑框内容翻译 描述:一个浏览器翻译插件,目前为第一个小版本,可翻译编辑框中的内容,欢迎提bug和想法。官网地址为typral.com。

浏览器插件翻译工具
做了一个小工具,把 links 旅行视频里的地点整理到 3D 地球上

做了一个小工具,把 links 旅行视频里的地点整理到 3D 地球上

产品主要功能和描述: 1. 将YouTube旅行摄影频道@linksphotograph里出现的地点整理并标到3D地球上。 2. 提供地点分布查看功能。 3. 可按地区/状态进行筛选。 4. 点击地点可查看对应视频。 5. 可标记地点为已去或想去。 6. 允许用户在本地产生旅行笔记。 7. 使用的技术包括Next.js 16、React 19、Tailwind v4和MapLibre GL。 8. 数据目前为静态JSON格式,没有后端服务。

Web应用地理信息系统(GIS)

净净的诞生

产品主要功能:智能过滤垃圾短信、短信分类整理、隐私保护。 描述:净净是一款能够帮助用户智能过滤垃圾短信的应用,通过AI工具辅助开发,实现了短信过滤、分类整理以及隐私保护等基础模块,提高了用户处理短信的效率。

AI工具开发工具

分享一个基于大语言模型驱动的多轮评审的高质量英文文章翻译方案

**产品主要功能描述** * **英文技术文章翻译润色**:基于大语言模型驱动的多轮评审的高质量英文文章翻译方案,能够将英文技术文章(涵盖AI、编程、产品、商业等领域,尤其是智能体相关内容)高质量地改写为中文。 * **工作流设计**:包含内容抓取、初步改写、多轮评审(并行评审、反思改进、综合改进)、最后润色等关键阶段,旨在提升英文技术文章的中文化质量和中文表达的自然度、专业性。 * **Prompt Engineering**:通过精心设计的Prompt,引导LLM生成更符合预期的翻译结果,包括语言流畅性、地道性、内容准确性、逻辑性、风格一致性等方面的优化。 * **模型选择与应用**:结合Google Gemini 2.0 Flash、Qwen-max-latest和OpenAI o3-mini等LLM模型,分别应用于初步改写、多轮评审和综合改进等阶段,以实现高效、准确的内容翻译和润色。 * **后续处理**:包括排版微调、封面生成和发布等,使最终发布的文章更具美观性和专业性。 总体而言,该产品是一款专注于提升英文技术文章翻译质量和中文表达能力的AI辅助翻译工具,通过工作流设计和Prompt Engineering技术,实现多轮评审和多维度优化,生成符合中文读者阅读习惯的高质量翻译文章。

AI工具翻译工具