LESESAAL
LESESAAL
Eine KI-gestützte Kunstbibliothek
Automatisierte Erfassung, Katalogisierung und Veröffentlichung einer Kunstbuch-Sammlung
Projektvision
Der LESESAAL ist eine vollautomatisierte Kunstbibliothek, die den gesamten Workflow von der physischen Buch-Erfassung bis zur öffentlichen Web-Veröffentlichung ohne manuelle Eingriffe abbildet. Kern ist die Integration von KI-Agenten, moderner Bildverarbeitung und einem robusten Tech-Stack.
Systemarchitektur
Überblick
┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐
│ Telegram │────▶│ OpenClaw │────▶│ Obsidian │
│ (Foto Upload) │ │ Agent System │ │ (Knowledge) │
└─────────────────┘ └─────────────────┘ └─────────────────┘
│
▼
┌─────────────────┐
│ Tech Stack │
│ - GLM LMM │
│ - Perplexity │
│ - Ollama │
└─────────────────┘
│
▼
┌─────────────────┐
│ Publishing │
│ - GitHub │
│ - Vercel │
│ - lesesaal.de │
└─────────────────┘
Komponenten im Detail
1. Eingabe-Layer: Telegram
Funktion: Mobile Datenerfassung
- Buchcover-Fotos werden direkt per Smartphone in einen dedizierten Telegram-Chat geschickt
- Automatische Weiterleitung an den OpenClaw-Agenten
- Unterstützt Batch-Uploads (mehrere Bücher gleichzeitig)
- Zeitstempel und Sender-Information für Protokollierung
Vorteile:
- Keine zusätzliche App nötig
- Sofortige Verfügbarkeit der Bilder
- Dezentrale Erfassung von überall
2. Agent-Layer: OpenClaw
Funktion: Zentrale Steuerung und Orchestrierung
Hardware:
- Mac mini Pro (Apple Silicon)
- Lokal gehostet für Datenschutz und Geschwindigkeit
- Continuous Operation via Daemon
OpenClaw Features:
- Multi-Agent-System: Spezialisierte Agenten für verschiedene Aufgaben
- Memory Management: Kontinuierliches Lernen über Bibliotheksstruktur
- Skill-Integration: Modulare Erweiterbarkeit
- Cron-Jobs: Automatisierte Background-Tasks
Agent-Rollen:
| Agent | Aufgabe |
|---|---|
| Buch-Agent | Bildanalyse und initiale Metadaten-Extraktion |
| Recherche-Agent | Perplexity-API für bibliografische Verifikation |
| Katalog-Agent | Erstellung von Markdown-Profilen |
| Index-Agent | Aktualisierung aller Index-Dateien |
| Publishing-Agent | Git-Commits und Deployment-Trigger |
3. KI-Analyse-Layer
3.1 Bildanalyse: GLM LMM über Ollama
Technologie:
- GLM-4 (General Language Model) als Large Multimodal Model
- Ollama als lokaler Inference-Server
- Cloud-Version für komplexe Analysen
Prozess:
- Bild wird vom Cover in Base64 kodiert
- Anfrage an GLM mit Prompt:
"Analysiere dieses Buchcover. Extrahiere: - Titel und Untertitel - Autor(en) - Verlag - Erscheinungsjahr - Visuelle Beschreibung des Covers - Vermutetes Genre/Thema" - Strukturierte Antwort mit Konfidenz-Scores
- Fallback zu menschlicher Verifizierung bei Unsicherheit
Vorteile:
- Lokal hostbar (Datenschutz)
- Keine API-Kosten für Basis-Analysen
- Schnelle Inferenz auf Apple Silicon
3.2 Tiefenrecherche: Perplexity Sonar
Technologie:
- Perplexity API (Sonar-Modell)
- Deep Research Capabilities
- Echtzeit-Web-Suche
Anwendung:
- Verifikation der extrahierten Metadaten
- Ergänzung fehlender Informationen (ISBN, Seitenzahl, etc.)
- Kontextuelle Recherche (Künstlerbiografie, Epoche, Bedeutung)
- Mehrsprachige Quellen (Deutsch, Englisch, Französisch)
Beispiel-Query:
"Finde bibliografische Details zu:
'Alt-Irland: Frühchristliches Irland' von Máire und Liam de Paor.
Verlag, Jahr, ISBN, Seitenzahl, Originaltitel."
Ergebnis:
- Strukturierte JSON-Daten
- Quellenangaben für jede Information
- Konfidenz-Rating
4. Knowledge-Layer: Obsidian + Digital Garden
Funktion: Zentrale Wissensdatenbank und Web-Publishing
Digital Garden Plugin: Das Obsidian-Plugin Digital Garden ist das Bindeglied zwischen dem Obsidian-Vault und der öffentlichen Website. Es übernimmt zwei zentrale Aufgaben:
-
Git-Commit & Push: Für jede Markdown-Datei, die mit
dg-publish: truemarkiert ist, steuert Digital Garden den automatisierten Git-Workflow. Sobald ein Buchprofil oder Index aktualisiert wird, committet und pusht das Plugin die Änderungen an das GitHub-Repository. -
Umwandlung in eine Website: Digital Garden wandelt die Obsidian-Markdown-Dateien (inklusive Wikilinks, Frontmatter, Embeds und Transklusionen) in eine statische Website um. Bilder, Querverweise und Metadaten werden korrekt aufgelöst und als navigierbare Website auf lesesaal.de veröffentlicht.
Schlüssel-Eigenschaften:
dg-publish: trueim Frontmatter steuert, welche Seiten veröffentlicht werden- Automatische Auflösung von
![[bild.jpg]]-Embeds zu Web-kompatiblen Bildern - Markdown-Links und Wikilinks werden zu funktionsfähigen Website-Links
- Inkrementelle Builds – nur geänderte Seiten werden neu generiert
Struktur:
📁 Bibliothek/
├── 📄 BIBLIOTHEK.md # Master-Katalog
├── 📁 _index/
│ ├── nach-kuenstler.md # Alphabetischer Index
│ ├── nach-lagerfach.md # Physische Standorte
│ ├── nach-epoche.md # Kunsthistorische Epochen
│ ├── nach-verlag.md # Verlags-Index
│ └── nach-erscheinungsjahr.md # Chronologischer Index
├── 📁 buecher/
│ ├── de-paor-maire-liam_alt-irland.md
│ ├── matisse-loeuvre-grave.md
│ └── ... (160+ Buchprofile)
└── 📁 covers/
├── bk0139-alt-irland-fruehchristliches-irland.jpg
└── ... (160+ Cover-Bilder)
Frontmatter-Schema:
---
id: "BK-0139"
titel: "Alt-Irland: Frühchristliches Irland"
autor: ["de Paor, Máire", "de Paor, Liam"]
verlag: "Deutscher Bücherbund"
erscheinungsjahr: "1960"
seiten: "263"
lagerfach: "A7"
cover_url: "../../covers/bk0139-alt-irland.jpg"
dg-publish: true
---
Automatisierte Index-Generierung:
- 6 verschiedene Index-Dateien
- Bidirektionale Links zwischen Büchern und Indizes
- Automatische Zähler-Aktualisierung
- Cross-Referencing
5. Publishing-Layer
5.1 GitHub Repository
Struktur:
lesesaal/
├── content/ # Obsidian Vault (Markdown)
├── public/ # Statische Assets (Cover-Bilder)
├── src/ # Publishing-Logik
├── package.json
└── vercel.json
Workflow:
- Agent führt
git add,git commit,git pushaus - Commit-Message mit Batch-Information
- Branch:
main→ auto-deployment - Backup via Git-History
5.2 Vercel Deployment
Konfiguration:
- Framework: Digital Garden oder Obsidian Publish Alternative
- Build Command:
npm run build - Output Directory:
dist/ - Edge Network: Global CDN
Features:
- Git-based Deployment: Jeder Commit = neuer Build
- Preview Deployments: Für jede Branch
- Edge Functions: Optional für dynamische Features
- Analytics: Built-in Performance-Monitoring
5.3 Domain: lesesaal.de
Setup:
- DNS-A-Record → Vercel Edge Network
- SSL-Zertifikat (auto-provisioned)
- Custom Domain-Konfiguration in Vercel Dashboard
- Rewrite-Rules für saubere URLs
Vollautomatisierter Workflow
Schritt-für-Schritt
1. USER: Fotografiert Buchcover mit Smartphone
↓
2. USER: Sendet Foto via Telegram an Agent
↓
3. OPENCLAW: Empfängt Bild, speichert in Inbox
↓
4. AGENT (Buch): Sendet Bild an GLM LMM (Ollama)
↓
5. GLM: Analysiert Cover, extrahiert Metadaten
↓
6. AGENT (Recherche): Sendet Query an Perplexity Sonar
↓
7. PERPLEXITY: Verifiziert und ergänzt Daten
↓
8. AGENT (Katalog): Erstellt Markdown-Profil
↓
9. AGENT (Index): Aktualisiert alle 6 Index-Dateien
↓
10. AGENT (Publishing): Git commit + push
↓
11. GITHUB: Triggert Vercel Build
↓
12. VERCEL: Baut und deployt statische Seite
↓
13. LEESESAAL.DE: Buch ist live verfügbar
Gesamtdauer: ~30-60 Sekunden pro Buch
Technologie-Stack Zusammenfassung
| Layer | Technologie | Zweck |
|---|---|---|
| Input | Telegram | Mobile Datenerfassung |
| Orchestration | OpenClaw | Agent-Management |
| Hardware | Mac mini Pro | Lokale Infrastruktur |
| Bildanalyse | GLM LMM + Ollama | KI-basierte Cover-Erkennung |
| Recherche | Perplexity Sonar API | Bibliografische Verifikation |
| Knowledge | Obsidian | Wissensdatenbank |
| Versioning | Git + GitHub | Quellcode-Management |
| Hosting | Vercel | Edge Deployment |
| Domain | lesesaal.de | Öffentliche Präsenz |
Aktueller Stand (April 2026)
Bibliotheksbestand:
- 160 Bücher vollständig katalogisiert
- 6 Index-Systeme automatisch gepflegt
- 23 neue Bücher zuletzt hinzugefügt (Batch BK-0139 bis BK-0161)
Features:
- ✅ Vollautomatische Erfassung via Telegram
- ✅ Multi-Source-Recherche (Bildanalyse + Perplexity)
- ✅ 6-fache Index-Aktualisierung
- ✅ Git-basierte Versionierung
- ✅ Automatisches Deployment
- ✅ Mobile-first Workflow
Roadmap:
KI-Basierte Bildgenerierung (v1.2)
Ab Version 1.2 generiert der LESESAAL für jedes Buchprofil automatisch ein KI-generiertes Titelbild. Der Prozess nutzt ComfyUI als lokale Bildgenerierungs-Pipeline und das Modell SD XL Turbo.
Workflow:
- Aus jedem Buchprofil werden Titel und Beschreibung per Python-Script extrahiert
- Daraus wird automatisch ein englischer Bild-Prompt generiert (Kunstbuch-spezifisch)
- Der Prompt wird als JSON-Workflow an die lokale ComfyUI API (Port 8000) gesendet
- SD XL Turbo generiert mit 8 Steps und CFG 1.5 ein 1024×1024 Bild
- Das generierte Bild wird als
BK-XXXX_titel-slug_sdxl.pngimcovers/-Verzeichnis gespeichert - In das Buchprofil wird das Bild zusammen mit dem verwendeten Prompt und dem Generierungsdatum eingefügt
Technische Details:
- Modell:
sd_xl_turbo_1.0_fp16.safetensors(lokal, kein Cloud-API) - Inference-Engine: ComfyUI Desktop App auf Mac mini Pro
- Generierungszeit: ca. 20–30 Sekunden pro Bild
- Cronjob: Automatisierte Batch-Verarbeitung alle 5 Minuten über OpenClaw
- Skip-Logik: Bücher ohne Profil werden automatisch übersprungen
- Status-Tracking:
.book-image-gen-stateverfolgt aktuellen und maximalen Buchindex
Philosophie
Der LESESAAL demonstriert, wie KI-Agenten und automatisierter Workflows traditionelle Domänen (Bibliothekswesen) transformieren können. Statt manueller Datenpflege entsteht ein lebendiges, selbst-organisierendes System, das:
- Zeit spart (Minuten statt Stunden pro Buch)
- Fehler reduziert (Automatische Verifikation)
- Zugänglich macht (Web-Präsenz für die Sammlung)
- Skaliert (Unbegrenzte Kapazität durch Automation)
Links
- 🔗 Website: https://lesesaal.de
- 📚 Repository: github.com/.../lesesaal
- 🤖 OpenClaw: https://openclaw.ai
- 🧠 Ollama: https://ollama.ai
- 🔍 Perplexity: https://perplexity.ai
Projektstart: 2026
Letztes Update: 2026-04-21
Maintainer: Marcuscha Lippetzschki