Qu'est-ce que le Memory OS d'OpenHuman ?

Memory OS est la métaphore d'architecture d'OpenHuman pour la couche mémoire IA personnelle : au lieu de l'historique de chat, un Memory Tree local-first normalise Gmail, Slack, GitHub et documents en chunks Markdown, les écrit dans SQLite et les résume en arbres Source, Topic et Global, miroir dans un wiki compatible Obsidian. L'agent lit et écrit via recall, search, drill_down et interfaces similaires.

Où OpenHuman stocke-t-il les données ?

Workspace par défaut : ~/.openhuman (ou OPENHUMAN_WORKSPACE). memory_tree/chunks.db contient chunks, scores, résumés et file de jobs ; wiki/ contient des .md lisibles. Les données brutes des connecteurs ne montent pas automatiquement au cloud avant canonicalize, sauf si vous les envoyez à une API modèle.

OpenHuman peut-il partager agentmemory avec Cursor ?

Oui. Avec memory.backend = "agentmemory" dans config.toml, OpenHuman proxy en REST vers agentmemory local et partage le même stock persistant avec Claude Code, Cursor, Codex et OpenCode — retrieval hybride BM25 + vector + graph.

Memory Tree vs base vectorielle RAG ?

Une base vectorielle répond surtout à « quel contenu est sémantiquement proche ? ». Memory Tree ajoute structure temporelle (digest Global quotidien), chaleur d'entités (Topic tree) et traçabilité (Source tree + provenance), avec mécanisme seal compressant le buffer L0 — arbre navigable plutôt qu'un sac de similarité.

OpenHuman exige-t-il un Mac ?

OpenHuman est Rust + Tauri ; le desktop cible macOS (builds cross-platform en cours). Sur Apple Silicon, Ollama sert aux embeddings locaux. Pour Auto-fetch 24/7 et daemon stable, beaucoup d'équipes choisissent un Cloud Mac dédié plutôt qu'un laptop en veille.

OpenHuman sur Cloud Mac vs Mac local ?

Expérience proche : macOS + SSH/VNC + disque persistant. Cloud Mac : reachabilité fixe, extension 1 To/2 To pour Memory Tree et caches modèles, nœuds US East/West/APAC pour latence SaaS. Mac local : privacy plus forte, pas de loyer mensuel, mais veille et réseau cassent Auto-fetch.

Même mémoire qu'OpenClaw ?

Non. OpenClaw met l'accent sur gateway multi-canal et outils ; la mémoire passe souvent par plugins ou DB externe. OpenHuman fait du Memory Tree une brique first-class avec Auto-fetch, vault Obsidian et UI Intelligence. Les deux peuvent coexister sur un Cloud Mac — séparez workspaces et ressources process.

La révolution Memory OS derrière OpenHuman : architecture mémoire IA personnelle 2026

En 2026, la course à l'IA personnelle passe de « le modèle est-il assez intelligent ? » à « l'agent se souvient-il de moi ? ». Memory ChatGPT, contexte projet Claude, AGENTS.md des coding agents — même douleur : les LLM sont stateless ; quelques bullets system prompt ne sont que des post-it. Le projet open source OpenHuman (TinyHumans AI, GPL-3.0) va plus loin en élevant « memory » au rang de CPU et scheduler : un Memory OS (système d'exploitation mémoire) — pas un plugin vectoriel, mais une pipeline Memory Tree local-first, auditable et éditable. Cet article décortique l'architecture et explique pourquoi les développeurs Apple Silicon font tourner ces agents 7×24 sur Mac mini M4 Cloud Mac.

Arbres de résumé : Source / Topic / Global

≤3k

Limite tokens par chunk Markdown déterministe

20min

Intervalle Auto-fetch par défaut (doc)

Pourquoi Memory OS plutôt qu'une fenêtre de contexte plus longue

Passer de 8K à 1M tokens ne change pas le fait : à la fin du chat, rien ne reste dans les poids. La « mémoire » produit ressemble souvent à :

quelques préférences utilisateur dans le system prompt ;
RAG session depuis une base vectorielle ;
plugins montant Notion ou Drive temporairement.

Cela soulage sans abstraction OS : ingest unifié, format persistant, scopes de retrieval, lifecycle et stockage lisible. La métaphore Memory OS d'OpenHuman : Memory Tree n'est pas « un wrapper de plus », mais une pipeline déterministe transformant mail, Slack, GitHub, transcriptions en base Markdown queryable par l'agent et ouvrable par l'utilisateur. La doc : « You can't trust a memory you can't read. »

Qu'est-ce qu'OpenHuman

OpenHuman est l'application desktop agent IA personnel local-first de TinyHumans (Rust + Tauri) — « memory and doer » de votre vie numérique, pas seulement chat. Contrairement aux frameworks terminal-first :

Memory Tree + Obsidian Wiki pour mémoire long terme structurée ;
Auto-fetch tire périodiquement les nouvelles données SaaS sans prompt manuel ;
Chaîne d'outils : recherche web, code, navigateur, Cron, multi-agent, voix, Google Meet Agent ;
118+ intégrations OAuth (tableau comparatif — voir doc à jour).

Autour de mai 2026, forte attention GitHub et Product Hunt — le différenciateur est Memory OS, pas une UI de chat de plus.

Cœur Memory OS : pipeline Memory Tree déterministe

Selon la doc Memory Tree, chaque donnée suit le même hot path :

Pipeline ingest Memory Tree (simplifié)

source adapters (chat / email / document)
        ↓
canonicalize    → Markdown normalisé + provenance
        ↓
chunker         → IDs déterministes, ≤3k tokens
        ↓
content_store   → fichiers .md atomiques sur disque
        ↓
store           → chunks.db (SQLite)
        ↓
score           → signaux + embedding + extraction entités
        ↓
source / topic / global trees  → résumés par scope
        ↓
retrieval       → search / drill_down / topic / global / fetch

Trois principes de design ingest

Deterministic : IDs content-addressed — pas de doublon à ingest répété.
Fast : hot path sans LLM, heuristiques bon marché seulement.
Bounded write : transaction unique — pas d'ingest à moitié en DB.

Travail lourd — embedding, entités, résumés seal, digest quotidien — dans la file de jobs background (3 workers par défaut, sémaphore limitant les appels LLM parallèles lors des pics Auto-fetch).

Trois arbres : Source, Topic, Global

Le « système de fichiers » Memory OS n'est pas un key-value plat mais trois arbres de résumé :

Arbre	Scope	Question type
Source tree	Par source connectée (label Gmail, canal Slack, document)	« Que disait le webhook Stripe mardi 15 h ? »
Topic tree	Entités (personne, projet, repo, ticker) par chaleur	« Résumé de tous les échanges avec ce client ? »
Global tree	Digest UTC quotidien	« Que s'est-il passé globalement aujourd'hui ? »

La similarité vectorielle agit en bas, mais la structure arborescente compresse et navigue — frontière avec le « sac RAG pur ». Cycle leaf : pending_extraction → admitted → buffered → sealed (ou dropped) ; retrieval remonte la provenance sans relancer la pipeline.

Obsidian Wiki : mémoire lisible, modifiable, supprimable

Double écriture : chaque chunk va dans memory_tree/chunks.db et en .md sous wiki/ — vault Obsidian, inspiré du workflow obsidian-wiki de Karpathy. La page Intelligence ouvre Obsidian ; les hits de recherche sautent au Markdown source.

Pour les développeurs :

versionner wiki/ avec Git (attention données sensibles) ;
corriger une mémoire agent erronée directement en .md ;
audit compliance : clair + scores + provenance, pas embeddings boîte noire.

Auto-fetch : Memory OS « tient la comptabilité » activement

La plupart des mémoires agent sont passives — @ fichier, coller lien, export manuel. Auto-fetch OpenHuman (~20 minutes) parcourt les connexions actives et écrit nouveaux mails, messages et PR dans Memory Tree. Le scheduler déclenche à UTC 0:00 digest global et flush des buffers stale.

Nouvelle UX : le matin l'agent a déjà « le contexte d'hier » — comme le page cache OS, pas un cold boot depuis le cloud.

Éditeur de code sur laptop développeur — OpenHuman et agents IA local-first sur Mac mini M4 Cloud Mac

Backend agentmemory : partager la mémoire avec Cursor et Codex

Si vous hébergez agentmemory (npx -y @agentmemory/agentmemory) pour Cursor ou Claude Code, définissez memory.backend = "agentmemory" dans config.toml. OpenHuman devient client REST mince ; storage, embedding et retrieval hybride (BM25 + vector + graph) passent par agentmemory.

Mapping typique (doc) :

store → POST /agentmemory/remember
recall → POST /agentmemory/smart-search
lifecycle : consolidation, retention scoring, auto-forget, graph extraction

chunking/sealing Memory Tree et trait backend sont orthogonaux — basculer agentmemory ne change pas l'ingest wiki Obsidian, mais le recall agent passe par la lib partagée. Migration : export SQLite → POST agentmemory → redémarrer config (pas de hot migrate).

Memory OS vs base vectorielle vs contexte chat

Approche	Force	Faiblesse typique
Historique chat allongé	Zéro infra	Non structuré, pas de compression inter-session, coût token linéaire
RAG vectoriel pur	Recall similarité rapide	Timeline, suivi entités, « que s'est-il passé aujourd'hui ? » difficile
OpenHuman Memory OS	Résumés arborescents + wiki clair + Auto-fetch + retrieval multi-scope	Disque local + desktop macOS ; APIs beta en évolution

Différence mémoire avec OpenClaw et autres agents

OpenClaw (souvent couvert ici) excelle en routing multi-canal, santé daemon, tunnel SSH vs WSS. Mémoire souvent plugin ou DB externe, pas Memory Tree intégré. OpenHuman productise la mémoire dans Intelligence : métriques, graphe entités, heatmap ingest, entrée Obsidian.

Les deux sur un Cloud Mac : OpenHuman comme OS connaissance personnelle, OpenClaw pour orchestration Telegram/Webhook — séparez OPENHUMAN_WORKSPACE et config OpenClaw, isolez pics CPU/RAM via launchd ou tmux (embedding et gateway ne se chevauchent pas).

OpenHuman sur Mac mini M4 Cloud Mac

Pourquoi Cloud Mac pour une app desktop ? Trois profils concrets :

Développeur Windows/Linux principal : macOS pour OpenHuman Tauri + Ollama Metal sans acheter de Mac — comme Xcode distant depuis Windows.
Auto-fetch 7×24 : veille laptop casse sync ; nœud M4 dédié reste en ligne SSH/VNC, Memory Tree grandit en continu.
Gros wiki : chunks.db + Obsidian + caches modèles — extension 1 To/2 To voir FAQ stockage M4.

Matériel : 16 Go vs 24 Go et Ollama

fast-score n'utilise pas le GPU ; embedding et résumés background si. Avec Local AI (Ollama) sur M4 — comme les expériences MLX/Ollama : 16 Go pour sync léger + petit modèle embed ; 24 Go pour workers parallèles, modèles embed plus grands et IDE ouvert. Disque : 1 To minimum pour IA + Memory OS.

Déploiement en bref

Louer Mac mini M4 Vuncloud, SSH, workspace sur volume persistant.
Installer release OpenHuman, configurer intégrations OAuth.
Premier Run ingest manuel, vérifier croissance wiki/ et métriques Intelligence.
(Optionnel) Ollama + Local AI pour embedding on-device.
(Optionnel) agentmemory pour recall partagé avec Cursor.

Memory OS ≠ AGI

OpenHuman ne prétend pas à l'AGI, mais en mémoire, orchestration et outils il se rapproche d'une architecture « OS IA personnel ». Évaluez via GitBook et release notes — la beta itère vite.

Acheter un Mac ou louer Cloud Mac pour Memory OS ?

Si Memory Tree est votre second cerveau productif avec mail pro et repos connectés, le Mac mini local séduit par privacy et absence de loyer — jusqu'au backup second site ou wiki miroir lecture seule partagé. Test court : louer un nœud dédié à la semaine pour OpenHuman + agentmemory ; long terme voir TCO local vs location. Équipes CI avec runner macOS GitHub Actions splittent souvent les locations en parallèle.

FAQ

Qu'est-ce que Memory OS ? Métaphore OpenHuman pour Memory Tree + wiki Obsidian + Auto-fetch — ingest, stockage, index, scheduler et retrieval comme un OS.

Où sont les données ? Par défaut ~/.openhuman/memory_tree/chunks.db et wiki/ — SQLite et Markdown locaux.

agentmemory avec Cursor ? Oui — memory.backend = "agentmemory" et service REST local.

Différence avec base vectorielle RAG ? Arbres Source/Topic/Global, digest temporel, wiki éditable — pas seulement similarité.

Mac obligatoire ? Desktop cible macOS ; 24/7 souvent Cloud Mac.

Conflit OpenClaw ? Pas forcément — séparer répertoires et ressources.

Beta stable ? Projet actif, itération rapide — sauvegardez chunks.db et wiki/ vous-même.

Conclusion

La voie Memory OS d'OpenHuman fait passer l'IA personnelle de « chat + RAG temporaire » à un OS connaissance local-first et auditable. ingest déterministe, trois arbres de résumé et double écriture Obsidian répondent à « pourquoi l'agent se souvient ? » — pas par un contexte plus grand, mais par une couche mémoire structurée. Sur Apple Silicon : Ollama et agentmemory localement, Cloud Mac si besoin de sync permanent — chemin 2026 concret pour l'ingénierie IA personnelle.