Vuncloud Blog
← Zurück zum Dev-Tagebuch

Die Memory-OS-Revolution hinter OpenHuman

Feldnotizen · 2026.05.26 ·ca. 14 Min.

Abstrakte Visualisierung neuronaler Netze und Wissensgraphen als Metapher für OpenHuman Memory OS und Memory Tree

2026 verschiebt sich der Wettbewerb um persönliche AI von „ist das Modell schlau genug?“ zu „erinnert sich der Agent an mich?“. ChatGPT Memory, Claude-Projektkontext, AGENTS.md in Coding Agents — alle lösen denselben Schmerz: LLMs sind stateless; System-Prompt-Bullets sind Post-its, keine Intelligenz. Das Open-Source-Projekt OpenHuman (TinyHumans AI, GPL-3.0) geht weiter und hebt „Memory“ auf die Ebene von CPU und Scheduler: ein Memory OS (Memory-Betriebssystem) — kein Vektor-Plugin, sondern local-first, auditierbare Memory-Tree-Pipeline. Dieser Artikel zerlegt die Architektur und erklärt, warum Apple-Silicon-Entwickler personal Agents zunehmend 7×24 auf Mac mini M4 Cloud Mac betreiben.

3
Summary-Bäume: Source / Topic / Global
≤3k
Token-Limit pro deterministischem Markdown-Chunk
20min
Auto-fetch Standardintervall (Doku)

Warum Memory OS statt längerem Kontextfenster

Kontext von 8K auf 1M Token ändert nichts daran: nach dem Chat bleibt nichts in den Modellgewichten. Produkt-„Memory“ ist meist:

  • einige Nutzerpräferenzen im System-Prompt;
  • Session-RAG aus einer Vektordatenbank;
  • Plugins, die Notion oder Drive temporär mounten.

Das hilft, fehlt aber OS-Abstraktion: einheitliches ingest, Persistenzformat, Retrieval-Scopes, Lifecycle und human-readable Storage. OpenHumans Memory-OS-Metapher: Memory Tree ist kein „noch ein Vector-Wrapper“, sondern normalisiert Mail, Slack, GitHub, Transkripte per deterministischer Pipeline zu Agent-querybarem, vom Nutzer öffbarem Markdown. Die Doku: „You can't trust a memory you can't read.“

Was ist OpenHuman

OpenHuman ist TinyHumans’ local-first Personal-AI-Agent-Desktop (Rust + Tauri) — „memory and doer“ Ihres digitalen Lebens, nicht nur Chat. Im Gegensatz zu Terminal-first Frameworks:

  • Memory Tree + Obsidian Wiki für strukturiertes Langzeitgedächtnis;
  • Auto-fetch zieht periodisch neue SaaS-Daten ohne manuellen Prompt;
  • Toolchain: Websuche, Code-Tools, Browser, Cron, Multi-Agent, Voice, Google Meet Agent;
  • 118+ OAuth-Integrationen (laut Vergleichstabelle — siehe aktuelle Doku).

Um Mai 2026 sorgte das Projekt auf GitHub und Product Hunt für Aufmerksamkeit — der Unterschied ist Memory OS, nicht noch eine Chat-UI.

Kern: deterministische Memory-Tree-Pipeline

Laut Memory Tree Doku durchläuft jeder Datensatz denselben Hot Path:

Memory Tree ingest (vereinfacht)
source adapters (chat / email / document)
        ↓
canonicalize    → normalisiertes Markdown + Provenance
        ↓
chunker         → deterministische IDs, ≤3k Token
        ↓
content_store   → atomische .md auf Disk
        ↓
store           → chunks.db (SQLite)
        ↓
score           → Signale + embedding + Entity-Extraktion
        ↓
source / topic / global trees  → Summaries pro Scope
        ↓
retrieval       → search / drill_down / topic / global / fetch

Drei Designprinzipien beim ingest

  • Deterministic: Chunk-IDs content-addressed — kein Duplikat bei wiederholtem ingest.
  • Fast: Hot Path ohne LLM, nur günstige Heuristiken.
  • Bounded write: Einzeltransaktion — kein halbfertiger ingest in der DB.

Schwere Arbeit — embedding, Entities, seal-Summaries, Daily digest — läuft in der Background job queue (Standard: 3 Worker, Semaphore limitiert parallele LLM-Calls gegen Auto-fetch-Spitzen).

Drei Bäume: Source, Topic, Global

Das „Dateisystem“ von Memory OS ist kein flaches Key-Value, sondern drei wachsende Summary-Bäume:

Baum Scope Typische Frage
Source tree Pro verbundener Quelle (Gmail-Label, Slack-Kanal, Dokument) „Was sagte der Stripe-Webhook am Dienstag 15 Uhr?“
Topic tree Entities (Person, Projekt, Repo, Ticker) nach Hotness „Zusammenfassung aller Kontakte mit diesem Kunden?“
Global tree Täglicher UTC-Digest „Was ist heute insgesamt passiert?“

Vektor-Ähnlichkeit wirkt unten mit, aber Baumstruktur liefert Kompression und Navigation — die Grenze zu „purem RAG-Sack“. Leaf-Lifecycle: pending_extraction → admitted → buffered → sealed (oder dropped); Retrieval kann provenance zurückverfolgen ohne Pipeline-Neulauf.

Obsidian Wiki: Memory muss lesbar, editierbar, löschbar sein

Dual-Write: jeder Chunk landet in memory_tree/chunks.db und als .md unter wiki/ — Obsidian-vault-kompatibel, inspiriert von Karpathys obsidian-wiki-Workflow. Die Intelligence-Seite bietet „In Obsidian öffnen“; Suchtreffer springen zur Quell-Markdown.

Für Entwickler:

  • wiki/ per Git versionieren (Datenschutz beachten);
  • fehlerhafte Agent-Memory direkt in .md korrigieren;
  • Compliance: Klartext + Scores + Provenance statt Black-Box-Embeddings.

Auto-fetch: Memory OS „bucht“ aktiv

Die meisten Agent-Memories sind passiv — @-Datei, Link paste, manueller Export. OpenHumans Auto-fetch (~20 Minuten) durchläuft aktive Verbindungen und schreibt neue Mails, Messages und PRs in Memory Tree. Der Scheduler triggert um UTC 0:00 global daily digest und stale buffer flush.

Neues Produktgefühl: morgens hat der Agent schon „den Kontext von gestern“ — wie OS page cache, nicht Cold-Boot-Mount aus der Cloud.

Code-Editor auf Entwickler-Laptop — OpenHuman und local-first AI Agents auf Mac mini M4 Cloud Mac

agentmemory-Backend: Memory mit Cursor und Codex teilen

Wenn Sie agentmemory (npx -y @agentmemory/agentmemory) für Cursor oder Claude Code betreiben, setzen Sie memory.backend = "agentmemory" in config.toml. OpenHuman wird REST-Dünnschicht; Storage, embedding und Hybrid-Retrieval (BM25 + vector + graph) übernimmt agentmemory.

Typische Mapping (Doku):

  • storePOST /agentmemory/remember
  • recallPOST /agentmemory/smart-search
  • Lifecycle: consolidation, retention scoring, auto-forget, graph extraction

Memory Trees chunking/sealing und trait backend sind orthogonal — agentmemory-Wechsel ändert Obsidian-wiki-ingest nicht, aber Agent-recall geht über die Shared Library. Migration: SQLite export → POST zu agentmemory → Config neu starten (kein Hot-Migrate).

Memory OS vs. Vektordatenbank vs. Chat-Kontext

Ansatz Stärke Typische Schwäche
Längerer Chat-Verlauf Null Infrastruktur Unstrukturiert, keine Session-übergreifende Kompression, Token-Kosten linear
Reines Vektor-RAG Schneller Similarity-Recall Timeline, Entity-Tracking, „was passierte heute?“ schwer
OpenHuman Memory OS Baum-Summaries + Klartext-wiki + Auto-fetch + Multi-Scope-Retrieval Lokale Disk + macOS-Desktop; Beta-APIs entwickeln sich

Memory-Unterschied zu OpenClaw & Co.

OpenClaw (oft in diesem Blog) glänzt bei Multi-Channel-Routing, Daemon-Health, SSH-Tunnel vs. WSS. Memory meist Plugin oder externe DB, kein eingebauter Memory Tree. OpenHuman produktisiert Memory in Intelligence: Metriken, Entity-Graph, ingest-Heatmap, Obsidian-Einstieg.

Beide auf einem Cloud Mac: OpenHuman als persönliches Wissens-OS, OpenClaw für Telegram/Webhook-Orchestrierung — trennen Sie OPENHUMAN_WORKSPACE und OpenClaw-Config, isolieren Sie CPU/RAM-Peaks per launchd oder tmux (embedding und Gateway nicht überlappen).

OpenHuman auf Mac mini M4 Cloud Mac

Warum Cloud Mac für eine Desktop-App? Drei konkrete Profile:

  • Windows/Linux-Hauptrechner: macOS für Tauri-OpenHuman + Ollama Metal embedding ohne Mac-Kauf — analog zu Remote-Xcode von Windows.
  • 7×24 Auto-fetch: Laptop-Sleep bricht Sync; dedizierter M4 bleibt per SSH/VNC online, Memory Tree wächst kontinuierlich.
  • Großes wiki: chunks.db + Obsidian + Modell-Caches — 1 TB/2 TB siehe M4-Speicher-FAQ.

Hardware: 16 GB vs. 24 GB und Ollama

Fast-score braucht keine GPU; Background embedding und Summaries schon. Mit Local AI (Ollama) auf M4 — wie bei MLX/Ollama-Experimenten: 16 GB für leichten Sync + kleines embed-Modell; 24 GB für parallele Worker, größere embed-Modelle plus IDE. Disk: ab 1 TB für AI + Memory OS.

Deployment in Kurzform

  1. Vuncloud Mac mini M4 mieten, SSH, Workspace auf persistentem Volume.
  2. OpenHuman release installieren, OAuth-Integrationen konfigurieren.
  3. Ersten Run ingest manuell, wiki/ und Intelligence-Metriken prüfen.
  4. (Optional) Ollama + Local AI für on-device embedding.
  5. (Optional) agentmemory für geteiltes recall mit Cursor.
Memory OS ≠ AGI
OpenHuman behauptet kein AGI, aber in Memory, Orchestrierung und Tooling nähert es sich einer „persönlichen AI-OS“-Architektur. Bewerten Sie anhand GitBook und Release Notes — Beta iteriert schnell.

Mac kaufen oder Cloud Mac für Memory OS mieten?

Ist Memory Tree Ihr produktives Second Brain mit Arbeitsmail und Repos, lockt lokaler Mac mini mit Privacy und ohne Miete — bis Backup am zweiten Ort oder geteiltes read-only wiki nötig wird. Kurz testen: OpenHuman + agentmemory wöchentlich mieten; langfristig siehe lokal vs. Remote TCO. CI-Teams mit GitHub Actions macOS runner splitten Mietperioden oft parallel.

FAQ

Was ist Memory OS? OpenHumans Metapher für Memory Tree + Obsidian wiki + Auto-fetch — ingest, Storage, Index, Scheduler und Retrieval wie ein OS.

Wo liegen Daten? Standard ~/.openhuman/memory_tree/chunks.db und wiki/ — SQLite plus Markdown lokal.

agentmemory mit Cursor? Ja — memory.backend = "agentmemory" und lokaler REST-Service.

Unterschied zu RAG-Vektordatenbank? Source/Topic/Global-Bäume, Zeit-digest, editierbares wiki — nicht nur Similarity search.

Mac Pflicht? Desktop zielt auf macOS; 24/7 oft Cloud Mac.

Konflikt mit OpenClaw? Nicht zwingend — Verzeichnisse und Ressourcen trennen.

Beta stabil? Aktives Projekt, schnelle Iteration — chunks.db und wiki/ selbst sichern.

Fazit

OpenHumans Memory-OS-Linie verschiebt persönliche AI von „Chat + temp RAG“ zu local-first, auditierbarem Wissens-OS. Deterministischer ingest, drei Summary-Bäume und Obsidian-Dual-Write beantworten „warum erinnert sich der Agent?“ — nicht durch größeren Kontext, sondern durch strukturierte Memory-Schicht. Auf Apple Silicon: Ollama und agentmemory lokal, bei Bedarf Cloud Mac für dauerhaften Sync — ein praktikabler 2026-Pfad für personal AI Engineering.

Mac mini M4 mieten — OpenHuman Memory OS 7×24

Mieten Sie bei Vuncloud einen dedizierten Mac mini M4 Cloud Mac für OpenHuman, Ollama-Embeddings und persistenten Memory-Tree-Workspace — Auto-fetch bricht nicht ab, wenn der Laptop schläft. Region wählen: US-Ost, US-West oder APAC.

Direktlinks: Mac Mini M4 Pakete, Hilfecenter, Zurück zum Blog.

AI-Entwickler

Persönliche AI-Memory — vom Cloud Mac aus

OpenHuman · Memory Tree · Ollama · Persistentes wiki

M4-Pakete ansehen
Cloud Mac M4 ansehen