利用 AI 实时捕捉屏幕和音频，转为结构化知识，GitHub 收获 6.2k Star

摘要：Glass是一个开源的桌面应用，它利用 AI 实时捕捉屏幕和音频，将这些信息转化为结构化的知识，为用户提供即时问答、会议摘要和个人知识管理服务，旨在成为用户的“数字思维扩展”。

Glass是一个开源的桌面应用，它利用 AI 实时捕捉屏幕和音频，将这些信息转化为结构化的知识，为用户提供即时问答、会议摘要和个人知识管理服务，旨在成为用户的“数字思维扩展”。

实时捕获与分析：Glass能实时监听屏幕和音频，理解上下文，转为结构化知识（如笔记、总结）。这样你可以问它问题，如 “刚刚我在看会议里那个图表，它是关于什么？”会议助手：能够实时生成会议笔记、摘要和记录，以及列出行动项（action items）等。支持多种底层模型与 API：默认支持 OpenAI API、 Google Gemini API；也支持使用本地运行的大语言模型（LLM）和语音转文本（STT）模型，如 Ollama 和 Whisper。隐形模式：设计为在屏幕录像或截图中不可见，并且不会在 Dock 中显示，以保护用户隐私。

即时启动（推荐）

从仓库下载现成 macOS 应用（[Download Here] 链接）；优势：无需构建，开箱即用，支持 macOS 系统。

本地构建

前置：安装 Python 和 Node.js 20.x.x（用 nvm 管理版本）；Windows 需 Visual Studio Build Tools。克隆仓库：git clone https://github.com/pickle-com/glass.git；安装：npm run setup（处理依赖）。运行：npm start 或类似脚本（推测，无明确细节）。要求：无互联网依赖（除 OpenAI API 调用），本地运行确保隐私。

更新

下载新 releases 或重新构建；数据本地保存，无迁移问题。