В 2026 фокус personal AI смещается с «достаточно ли умна модель?» на «помнит ли agent обо мне». Memory в ChatGPT, project context в Claude, AGENTS.md у coding agents — одна боль: LLM по сути stateless; bullets в system prompt — стикеры, не intelligence. Open-source проект OpenHuman (TinyHumans AI, GPL-3.0) идёт дальше и поднимает «memory» до уровня CPU и scheduler: Memory OS (операционная система памяти) — не vector plugin, а local-first, auditable Memory Tree pipeline. Разберём архитектуру и почему Apple Silicon developers всё чаще держат personal agents 7×24 на Mac mini M4 Cloud Mac.
Зачем Memory OS, а не более длинное context window
Context window с 8K до 1M tokens не меняет факт: после чата в model weights ничего не остаётся. Product «memory» обычно:
- несколько user preferences в system prompt;
- session RAG из vector database;
- plugins, временно монтирующие Notion или Drive.
Это помогает, но нет OS-level abstraction: единый ingest, persistent format, retrieval scopes, lifecycle и human-readable storage. Метафора Memory OS у OpenHuman: Memory Tree — не «ещё один vector wrapper», а deterministic pipeline, превращающая mail, Slack, GitHub, transcripts в Markdown knowledge base, queryable agent'ом и открываемую пользователем. Документация: «You can't trust a memory you can't read.»
Что такое OpenHuman
OpenHuman — local-first personal AI agent desktop от TinyHumans (Rust + Tauri): «memory and doer» цифровой жизни, не просто chat box. В отличие от terminal-first frameworks:
- Memory Tree + Obsidian Wiki для structured long-term memory;
- Auto-fetch периодически тянет новые SaaS data без manual prompt;
- Toolchain: web search, code tools, browser, Cron, multi-agent, voice, Google Meet Agent;
- 118+ OAuth integrations (comparison table — см. актуальную доку).
Около мая 2026 проект получил внимание на GitHub и Product Hunt — differentiator в Memory OS, а не очередной Chat UI.
Ядро Memory OS: deterministic Memory Tree pipeline
По доку Memory Tree каждый dataset идёт по одному hot path:
source adapters (chat / email / document)
↓
canonicalize → normalized Markdown + provenance
↓
chunker → deterministic IDs, ≤3k tokens
↓
content_store → atomic .md files on disk
↓
store → chunks.db (SQLite)
↓
score → signals + embedding + entity extraction
↓
source / topic / global trees → summaries per scope
↓
retrieval → search / drill_down / topic / global / fetch
Три design principles ingest
- Deterministic: chunk IDs content-addressed — repeat ingest не создаёт duplicate rows.
- Fast: hot path без LLM, только cheap heuristics.
- Bounded write: single transaction — no half-finished ingest в DB.
Heavy work — embedding, entity extraction, seal summaries, daily digest — в background job queue (default 3 workers, semaphore ограничивает parallel LLM calls при Auto-fetch spikes).
Три дерева: Source, Topic, Global
«Файловая система» Memory OS — не flat key-value, а три растущих summary tree:
| Tree | Scope | Типичный query |
|---|---|---|
| Source tree | На каждый connected source (Gmail label, Slack channel, document) | «Что сказал Stripe webhook во вторник в 15:00?» |
| Topic tree | Entities (person, project, repo, ticker) по hotness | «Summary всех контактов с этим клиентом?» |
| Global tree | Daily UTC digest | «Что в целом произошло сегодня?» |
Vector similarity работает внизу, но tree structure даёт compression и navigation — watershed между Memory OS и «pure RAG vector bag». Leaf lifecycle: pending_extraction → admitted → buffered → sealed (или dropped); retrieval может trace provenance без rerun pipeline.
Obsidian Wiki: memory должна быть readable, editable, deletable
Dual-write: chunk попадает в memory_tree/chunks.db и как .md в wiki/ — Obsidian vault compatible, inspired by Karpathy obsidian-wiki workflow. Intelligence page даёт «Open in Obsidian»; search hits jump к source Markdown.
Для developers:
- version control
wiki/через Git (sanitize sensitive data); - если agent «ошибся в memory», правите .md напрямую;
- compliance audit: plaintext + scores + provenance, не black-box embeddings.
Auto-fetch: Memory OS активно «ведёт учёт»
У большинства agents memory passive — @ file, paste link, manual export. Auto-fetch OpenHuman (~20 minutes) обходит active connections и пишет new mail, messages, PRs в Memory Tree. Scheduler в UTC 0:00 triggers global daily digest и stale buffer flush.
Новый product mindset: утром agent уже имеет «вчерашний context» — как OS page cache, не cold boot mount из cloud drive.
Backend agentmemory: shared memory с Cursor и Codex
Если вы self-host agentmemory (npx -y @agentmemory/agentmemory) для Cursor или Claude Code, задайте memory.backend = "agentmemory" в config.toml. OpenHuman становится REST thin client; storage, embedding и hybrid retrieval (BM25 + vector + graph) на agentmemory.
Typical mapping (docs):
store→POST /agentmemory/rememberrecall→POST /agentmemory/smart-search- lifecycle: consolidation, retention scoring, auto-forget, graph extraction
Memory Tree chunking/sealing pipeline и trait backend orthogonal — switch на agentmemory не ломает Obsidian wiki document ingest, но agent-side recall идёт через shared library. Migration path: export SQLite → POST to agentmemory → change config restart (no in-place hot migration).
Memory OS vs vector DB vs chat context
| Approach | Strength | Typical weakness |
|---|---|---|
| Extended chat history | Zero infrastructure | No structure, no cross-session compression, token cost linear |
| Pure vector RAG | Fast semantic similarity recall | Timeline, entity tracking, «what happened today» — hard |
| OpenHuman Memory OS | Tree summaries + plaintext wiki + Auto-fetch + multi-scope retrieval | Local disk + macOS desktop; beta APIs still evolving |
Memory difference vs OpenClaw и других agents
OpenClaw (часто в этом блоге) силён в multi-channel routing, daemon health, SSH tunnel vs WSS. Memory обычно через plugins или external DB, не built-in Memory Tree. OpenHuman productizes memory в Intelligence page: storage metrics, entity graph, ingest heatmap, Obsidian entry.
Engineering: оба могут coexist на одном Cloud Mac — OpenHuman как long-term personal knowledge OS, OpenClaw для Telegram/Webhook task orchestration. Разделите OPENHUMAN_WORKSPACE и OpenClaw config dirs, isolate CPU/RAM peaks через launchd или tmux (embedding и gateway peaks не overlap).
OpenHuman на Mac mini M4 Cloud Mac
Desktop agent — зачем Cloud Mac? Три concrete user profiles:
- Windows/Linux primary machine developers: macOS для Tauri OpenHuman + Ollama Metal embedding без покупки Mac — та же логика, что remote Xcode с Windows.
- 7×24 Auto-fetch: laptop sleep прерывает scheduled sync; dedicated M4 node online через SSH/VNC, Memory Tree растёт continuously.
- Large wiki: chunks.db + Obsidian + model caches — 1 TB/2 TB extension см. M4 storage FAQ.
Hardware tiers: 16 GB vs 24 GB и Ollama
Memory Tree fast-score path не ест GPU, но background embedding и summaries вызывают LLM. С Local AI (Ollama) на M4 — как в MLX/Ollama experiments: 16 GB для light sync + small embed model; 24 GB для concurrent workers, larger embed models и IDE open. Disk: from 1 TB для AI + Memory OS.
Deploy steps summary
- Арендовать Vuncloud Mac mini M4, SSH login, workspace на persistent volume.
- Install OpenHuman release, configure OAuth integrations.
- First manual Run ingest, confirm
wiki/и Intelligence metrics growth. - (Optional) Ollama + Local AI для on-device embedding.
- (Optional) agentmemory для shared recall с Cursor workflow.
Купить Mac или арендовать Cloud Mac для Memory OS?
Если Memory Tree — ваш production-grade second brain с work email и code repos, local Mac mini с privacy и zero monthly rent привлекателен — пока не нужен second-site backup или team shared read-only wiki mirror. Short-term validation OpenHuman + agentmemory: weekly dedicated node; long-term high utilization — local vs remote rent TCO. CI teams с GitHub Actions macOS runner часто split parallel rent periods.
FAQ
Что такое Memory OS? OpenHuman metaphor для local Memory Tree + Obsidian wiki + Auto-fetch — memory как OS с ingest, storage, index, scheduler и retrieval APIs.
Где data? Default ~/.openhuman/memory_tree/chunks.db и wiki/ — local SQLite + Markdown.
Shared agentmemory с Cursor? Да — memory.backend = "agentmemory" и local REST service.
Vs RAG vector DB? Source/Topic/Global tree summaries, time digest, editable wiki — не только similarity search.
Mac required? Desktop edition для macOS; 24/7 scenarios часто Cloud Mac.
Conflict с OpenClaw? Not necessarily — separate directories и resource isolation.
Beta stable? Active project, fast iteration — backup chunks.db и wiki/ yourself for production.
Вывод
Memory OS route OpenHuman двигает personal AI от «chat + temporary RAG» к local-first, auditable, syncable knowledge OS. Deterministic ingest, three summary trees и Obsidian dual-write отвечают «почему agent помнит меня» — не bigger context, а structured memory layer. Для Apple Silicon developers: Ollama и agentmemory locally, scale to Cloud Mac для persistent sync — workable 2026 personal AI engineering path.
Аренда Mac mini M4 — OpenHuman Memory OS 7×24
Арендуйте выделенный Mac mini M4 Cloud Mac на Vuncloud для OpenHuman, Ollama local embeddings и persistent Memory Tree workspace — Auto-fetch не прерывается, когда laptop sleeps. Выберите US East, US West или APAC node по latency.
Быстрые ссылки: Тарифы Mac Mini M4, Центр помощи, К блогу.