利用 AI 实时捕捉屏幕和音频,转为结构化知识,GitHub 收获 6.2k Star

B站影视 韩国电影 2025-09-21 07:55 1

摘要:Glass是一个开源的桌面应用,它利用 AI 实时捕捉屏幕和音频,将这些信息转化为结构化的知识,为用户提供即时问答、会议摘要和个人知识管理服务,旨在成为用户的“数字思维扩展”。

Glass是一个开源的桌面应用,它利用 AI 实时捕捉屏幕和音频,将这些信息转化为结构化的知识,为用户提供即时问答、会议摘要和个人知识管理服务,旨在成为用户的“数字思维扩展”。

实时捕获与分析:Glass能实时监听屏幕和音频,理解上下文,转为结构化知识(如笔记、总结)。这样你可以问它问题,如 “刚刚我在看会议里那个图表,它是关于什么?”会议助手:能够实时生成会议笔记、摘要和记录,以及列出行动项(action items)等。支持多种底层模型与 API:默认支持 OpenAI API、 Google Gemini API;也支持使用本地运行的大语言模型(LLM)和语音转文本(STT)模型,如 Ollama 和 Whisper。隐形模式:设计为在屏幕录像或截图中不可见,并且不会在 Dock 中显示,以保护用户隐私。

即时启动(推荐)

从仓库下载现成 macOS 应用([Download Here] 链接); 优势:无需构建,开箱即用,支持 macOS 系统。

本地构建

前置:安装 Python 和 Node.js 20.x.x(用 nvm 管理版本);Windows 需 Visual Studio Build Tools。 克隆仓库:git clone https://github.com/pickle-com/glass.git; 安装:npm run setup(处理依赖)。 运行:npm start 或类似脚本(推测,无明确细节)。 要求:无互联网依赖(除 OpenAI API 调用),本地运行确保隐私。

更新

下载新 releases 或重新构建;数据本地保存,无迁移问题。

来源:一斚一点号

相关推荐