Inhalt zusammenfassen mit:
Famulor Product Update Mai 2026: GPT Realtime 2, Sonic 3.5, GPT-5.5 und Self-Service-Telephony
Das Mai-2026-Release rollt das größte Voice-Stack-Upgrade des Jahres aus: OpenAI GPT Realtime 2 im Speech-to-Speech- und Dualplex™-Modus, Cartesia Sonic 3.5 als neue Voice-Engine, GPT-5.5 im Pipeline-Modus, Self-Service-Importe für Twilio, Telnyx, Zadarma und DIDLogic, Post-Call-Re-Transkription, ein neues Split-View-Detailpanel, API-Endpoints für AI-Pause pro Conversation und Auto-Top-Up für Chat-Credits. Dieser Beitrag erklärt jede Änderung, zeigt wann sie wofür Sinn ergibt und wie Sie sie in Ihrem Assistant aktivieren.
Kurz: Wenn Sie auf Famulor produktive Voice-Agents fahren, profitiert Ihr Stack ab sofort von höherer Instruction-Following-Qualität, natürlicher klingender Sprache, niedrigerer Latenz und einfacherer Carrier-Anbindung — ohne Konfigurationsaufwand. Mehrere Upgrades greifen automatisch, andere lassen sich pro Assistant aktivieren.
Highlights auf einen Blick
| Feature | Modus | Aktivierung | Hauptnutzen |
|---|---|---|---|
| GPT Realtime 2 | Speech-to-Speech, Dualplex™ | Automatisch in Dualplex™-Assistants | Zuverlässigeres Prompt-Following |
| Cartesia Sonic 3.5 | TTS Voice-Engine | Automatisch für Cartesia-Voices | Natürlichere Stimme, stabilere Aussprache |
| GPT-5.5 | Pipeline-Modus | Im Assistant-Picker wählen | Schnelle, intelligente Responses ohne Flaggschiff-Kosten |
| Bring Your Own Telephony | SIP-Wizard | Self-Service-Importer | Twilio/Telnyx/Zadarma/DIDLogic ohne Support-Ticket |
| Post-Call Re-Transkription | Dualplex™ + Multimodal | Auf Knopfdruck in der Call-Ansicht | Neu-Transkription mit stärkstem STT-Modell |
| Split-View Detail Panels | Calls & Conversations | Automatisch in der Liste | Side-by-Side-Ansicht statt Zurückspringen |
| AI deaktivieren pro Conversation | WhatsApp/Chat-Handoff | 2 neue API-Endpoints | Sauberer Human-Handoff |
| Auto Top-Up Chat Credits | Billing | Im Billing-Bereich aktivieren | Keine Unterbrechungen bei Chat-Volumen |
🧠 GPT Realtime 2 — Besseres Prompt-Following im Speech-to-Speech und Dualplex™
Unser Speech-to-Speech- und Dualplex™-Modus läuft jetzt mit OpenAI GPT Realtime 2. Der größte Gewinn: deutlich zuverlässigeres Prompt-Following. Der Assistent bleibt sauber im Skript, respektiert Anweisungen präziser und hält auch bei mehrstufigen Gesprächen stabil den Kontext.
Was das in der Praxis bedeutet — drei typische Szenarien aus dem Famulor-Kundenstamm:
- Lead-Qualifizierung mit Skript — Sales-Teams definieren einen festen Gesprächspfad (Hallo → Bedarf → Budget → Termin). GPT Realtime 2 weicht von diesem Pfad seltener ab, fragt die richtigen Slots in der richtigen Reihenfolge ab und hält den Kontext über Unterbrechungen hinweg.
- Compliance-kritische Workflows — In regulierten Branchen müssen bestimmte Hinweise wörtlich vorgelesen werden (Datenschutz, EU-AI-Act Article 50(3) Transparenz). Die neue Pipeline verschluckt diese Formulierungen seltener.
- Multi-Step-Triage — Empfangsszenarien mit drei oder vier verschachtelten Entscheidungen (z. B. „Erst nach Patientennummer fragen, dann nach Symptom, dann triagieren") laufen stabiler ohne Schleifenbruch.
In Kombination mit unserer proprietären Dualplex™-Technologie liefert das die beste Voice-Qualität, niedrigste Latenz und zuverlässigste Instruction-Following-Leistung auf einer AI-Calling-Plattform. Wer bereits Dualplex™ nutzt, ist automatisch upgraded — keine Konfiguration nötig. Wer noch auf einem klassischen Pipeline-Modus läuft, kann den Modus im No-Code-Builder umstellen.
🎙 Cartesia Sonic 3.5 — Voice-Engine-Upgrade automatisch aktiv
Die Cartesia Voice Engine wurde auf Sonic 3.5 aktualisiert. Stimmen klingen spürbar natürlicher, bleiben in langen Calls stabiler und sprechen schwierige Wörter sowie Namen konsistenter aus. Das Upgrade gilt automatisch für alle Assistenten mit Cartesia-Voices — ohne Konfigurationsänderungen.
Drei Use Cases, bei denen Sonic 3.5 besonders zählt:
- Outbound-Kampagnen mit langen Skripten — Bei 60-Sekunden-plus-Pitches hörte man bei früheren Sonic-Versionen mitunter „Stimm-Drift". Sonic 3.5 hält den Klang über die volle Länge stabil.
- Eigennamen und Branchen-Jargon — Pharmaceutical, Legal, Real Estate haben jeweils eigene Wortpools. Die neue Engine spricht Fachbegriffe konsistenter aus.
- Mehrsprachige Kampagnen — In gemischten EN/DE-Calls (z. B. Tech-Support für SaaS) sind die Sprachwechsel sauberer.
Sie müssen nichts tun. Wer testen möchte, lädt sich ein altes Call-Recording herunter, ersetzt die Voice im Assistant und vergleicht. Die Voice-Auswahl finden Sie wie gewohnt in der Assistant-Konfiguration unter Synthesizer.
⚡️ GPT-5.5 — Neues Language Model im Pipeline-Modus
GPT-5.5 steht jetzt als Language Model im Pipeline-Modus zur Verfügung. Ein starker Allrounder mit schnellen Antworten, solidem Reasoning und sehr gutem Prompt-Following — ideal, wenn Sie Geschwindigkeit und Intelligenz ohne Flaggschiff-Kosten kombinieren möchten. Sofort verfügbar in der Pipeline-Konfiguration Ihres Assistenten.
Wann GPT-5.5 die richtige Wahl ist:
| Szenario | Empfohlenes LLM | Begründung |
|---|---|---|
| FAQ + Terminbuchung in einem Vertical | GPT-5.5 | Schnell, kostengünstig, sehr gutes Instruction-Following |
| Komplexe Outbound-Sales-Kampagne mit Einwand-Handling | GPT Realtime 2 (Dualplex™) | Niedrigste Latenz, beste Konversationsdynamik |
| Long-Context-Recherche mit großem Knowledge-Base-Zugriff | Frontier-Modell (GPT-5 / Claude) | Maximales Reasoning für komplexe Lookups |
| Low-Cost-FAQ-Bot mit hohem Volumen | GPT-5.5 | Bestes Preis-Leistungs-Verhältnis im Pipeline-Modus |
📞 Bring Your Own Telephony — Self-Service-Carrier-Importe
Sie können jetzt eigene Carrier-Accounts direkt über einen geführten Import-Wizard verbinden — ohne Support-Ticket und ohne manuelles SIP-Setup. Das war bislang der zeitraubendste Schritt im Onboarding und ist jetzt ein Self-Service-Flow.
- Twilio SIP Trunks — Vollständiger Self-Service-Import mit Schritt-für-Schritt-Onboarding-Panel. Pricing transparent vorab kalkulierbar im Twilio-Rechner.
- Telnyx — Verbindung über denselben Wizard-Flow wie bei Twilio. Pricing-Check via Telnyx-Rechner.
- Zadarma & DIDLogic — Zwei zusätzliche Carrier im Picker für mehr Regions- und Pricing-Flexibilität, besonders attraktiv für osteuropäische und asiatische Nummernkreise.
Konkrete Anwendung: Wer bereits einen Twilio-Account mit gekauften Nummern hat, kann diese in unter 5 Minuten zu Famulor portieren — ohne Nummern neu kaufen zu müssen und ohne Carrier-Wechsel. Das senkt die Onboarding-Friktion bei Enterprise-Kunden, die feste Telephony-Verträge haben, drastisch.
🎤 Post-Call Re-Transkription für Dualplex™ und Multimodal
Abgeschlossene Calls lassen sich jetzt jederzeit aus der Originalaufnahme neu transkribieren — ideal, wenn Sie eine erneute Verarbeitung mit dem leistungsstärksten STT-Modell durchführen möchten. Verfügbar für Dualplex™- und Multimodal-Assistenten, inklusive transparenter Abrechnungsansicht direkt in der Assistant-Ansicht.
Drei häufige Gründe, einen Call neu zu transkribieren:
- QA und Coaching — Wenn ein automatisch generiertes Transkript Fehler enthält, lässt sich der Call mit dem stärkeren STT neu prozessieren — etwa für Trainings-Datenextraktion.
- Compliance-Audit — Bei DSGVO-Anfragen oder rechtlichen Streitigkeiten wird oft die maximal saubere Version eines Gesprächs gebraucht. Neu-Transkription liefert die.
- Feature-Extraktion — Wenn neue Extracted Variables nachträglich definiert werden, hilft eine Re-Transkription, um sie aus alten Gesprächen zu ziehen.
📂 Split-View Detail Panels — Calls und Conversations
Die Listenansichten für Calls und Conversations bieten jetzt ein Side-by-Side-Detailpanel: links Datensatz auswählen, rechts alle Details sehen — ohne ständiges Zurückspringen. Bei hohen Call-Volumina ist das ein massiver Workflow-Beschleuniger.
- Performance-Indizes — deutlich schnelleres Navigieren zwischen Datensätzen, auch bei sehr großen Listen.
- Extracted Variables Section — extrahierte Variablen werden jetzt in einem eigenen Bereich der Conversation-Details angezeigt. Das war historisch tief im UI vergraben und ist jetzt First-Class.
Wer mit Famulor täglich auditiert oder QA-Reviews fährt, gewinnt hier signifikant Zeit. Die Ansicht ist Teil aller Plan-Tiers — kein separates Add-On.
Berechnen Sie Ihren ROI durch automatisierte Anrufe
Erfahren Sie, wie viel Sie durch KI-gesteuerte Voice Agents jeden Monat sparen können.
ROI Ergebnis
ROI 228%
Ohne Kreditkarte
💬 AI pro Conversation deaktivieren und aktivieren
Zwei neue API-Endpoints erlauben das programmatische Pausieren und Fortsetzen der AI pro einzelner Conversation — perfekt für Human-Handoff-Workflows in WhatsApp und Chat. Ist AI deaktiviert, übernimmt Ihr Team manuell; bei Bedarf aktivieren Sie die AI wieder für die nächste Übergabe.
Das ist ein zentrales Feature für Customer-Support-Teams, die hybrid arbeiten — etwa 80% der einfachen Fälle vom Bot, die Eskalations- und VIP-Fälle vom Menschen. Beispiel-Workflow:
- Eingehender WhatsApp-Chat — Bot übernimmt FAQ.
- Kunde bittet um menschlichen Agenten — Webhook triggert
POST /conversation/{id}/ai-disable. - Conversation landet im Lead-Kanban beim Mensch-Team, die Konversation läuft komplett manuell weiter.
- Ist das Anliegen gelöst, ruft das Team
POST /conversation/{id}/ai-enableauf — Bot übernimmt wieder Routing, Follow-up oder Closing.
Vollständige Dokumentation der Endpoints finden Sie im Integrations-Bereich und der Developer-API.
💸 Auto Top-Up für Chat Credits
Chat Credits können jetzt automatisch nachgeladen werden, sobald das Guthaben niedrig ist. E-Mail-Benachrichtigungen informieren transparent über jede Aufladung. So bleiben Chat-Erlebnisse auch über Nacht ohne Unterbrechung stabil.
Sinnvoll vor allem für Teams mit:
- Hohem WhatsApp-Volumen — Wenn nachts plötzlich eine Kampagne hochläuft, läuft der Bot ohne Zwangspause weiter.
- Saisonalen Spitzen — Black Friday, Weihnachten, Steuerzeitraum — keine manuelle Aufladung mehr nötig.
- Multi-Standort-Setups — Niederlassungen müssen sich nicht mehr selbst um das Aufladen kümmern.
Aktivierbar im Billing-Bereich Ihres Accounts. Das Limit lässt sich frei wählen — keine Schwellenwerte fest vorgegeben.
🔄 Telephony- und Call-Flow-Verbesserungen
- Initial Message bei AI-zu-AI-Transfer — Der Ziel-Assistent spricht seine Initial Message sofort für einen nahtlosen Handoff zwischen zwei Famulor-Assistenten. Wichtig bei Multi-Bot-Architekturen, in denen ein Empfangs-Bot an einen Specialist-Bot übergibt.
- Transfer-Caller-Details sichtbar — Transfer-Ziel und Client-Telefonnummer werden in Transfer-Calls in der Call-Ansicht angezeigt. Erleichtert Debugging und QA bei komplexen Routing-Setups erheblich.
- Single-Character Tool Parameter Names — Tool-Parameter können jetzt auch aus einem einzelnen Zeichen bestehen (praktisch für kompakte JSON-Schemas in token-sensitiven Setups).
🛠 Weitere Verbesserungen und Fixes
- WhatsApp pre-verified number deletion — Löschen vorverifizierter WhatsApp-Nummern funktioniert jetzt zuverlässig.
- Phone number deletion — Löschjobs für Telefonnummern laufen stabiler, inklusive korrektem Logging im Fehlerfall.
Migration: Wann lohnt sich der Wechsel auf Dualplex™?
Dualplex™ ist Famulors proprietäre Architektur für Voice-Agents, die echtes Turn-Taking, niedrigste Latenz und sauberes Barge-In erlaubt. Mit GPT Realtime 2 als Backbone ist der Unterschied zum klassischen Pipeline-Modus jetzt noch deutlicher. Drei Indikatoren, dass Ihr aktueller Assistent vom Wechsel profitieren würde:
- Sie hören Pausen vor Antworten — Pipeline-Setups haben prinzipbedingt eine STT-Komplettierungs-Verzögerung. Dualplex™ verarbeitet parallel und antwortet in der Wahrnehmung sofort.
- Anrufer unterbrechen den Bot häufig — Dualplex™ behandelt Unterbrechungen sauberer; der Bot stoppt sofort und hört zu.
- Multi-Step-Skripte mit hoher Compliance-Anforderung — Mit GPT Realtime 2 ist die Wortwahl-Treue in Dualplex™ jetzt das Beste, was Famulor liefern kann.
Die Umstellung ist im Assistant-Editor ein Klick. Wir empfehlen einen Parallel-Test: alten Assistant als Backup behalten, neuen Dualplex™-Assistant in Production schalten, 100 Calls vergleichen.
Was Sie ab heute tun sollten
- Dualplex™-Assistenten prüfen — Tasten Sie GPT Realtime 2 in einem Testlauf an einem typischen Skript ab. Die Verbesserung beim Instruction-Following ist messbar im ersten Call.
- Cartesia-Voices in Aussprache-kritischen Skripten testen — Eigennamen, Pharmaceutical, Legal — Sonic 3.5 sollte hier merklich konsistenter sein.
- GPT-5.5 evaluieren — Wer aktuell GPT-4o oder GPT-5 für FAQ-Bots nutzt, sollte den Kosten-Performance-Vergleich machen. Ein A/B-Test auf 100 Calls genügt für eine belastbare Entscheidung.
- Carrier-Self-Service nutzen — Wer Twilio/Telnyx/Zadarma/DIDLogic hat, kann das Onboarding selbst durchziehen. Spart Wartezeit und Support-Roundtrips.
- AI-Pause-Endpoints in Ihren Helpdesk integrieren — Wer hybride Support-Workflows fährt, sollte die neuen Endpoints in das Eskalations-Routing einbauen.
Fazit
Das Mai-2026-Release adressiert die drei häufigsten Pain Points unserer Power-User: Instruction-Following bei mehrstufigen Gesprächen, Natürlichkeit der Stimme bei langen Calls und Friction beim Verbinden eigener Telephony. GPT Realtime 2 plus Cartesia Sonic 3.5 plus Self-Service-SIP-Wizards heben den Standard, an dem produktive Voice-Agents 2026 gemessen werden, deutlich an.
Wer Famulor noch nicht produktiv einsetzt, sollte sich die neuen Features in einer Live-Demo zeigen lassen — eine Demo-Konfiguration ist in 20 Minuten gebaut. Für Bestandskunden: Die meisten Upgrades sind automatisch aktiv, einige (GPT-5.5, Auto-Top-Up, AI-Pause) müssen pro Assistant oder Account eingeschaltet werden.
Den vollständigen Famulor Changelog und Blog finden Sie wie gewohnt mit allen Release Notes der letzten Wochen. Wer ein Detail wünscht: support@famulor.io oder direkt in der Plattform per Chat-Widget.
Testen Sie unseren KI-Assistenten
Erleben Sie selbst, wie natürlich unser KI-Telefonassistent klingt.
Geben Sie Ihre Daten ein und erhalten Sie in wenigen Sekunden einen Anruf von unserem KI-Agenten.
Der Agent ist darauf trainiert, über Famulor-Services zu sprechen und Termine zu vereinbaren.

Demo AI agent
Famulor Mitarbeiter
FAQ
Muss ich GPT Realtime 2 manuell aktivieren?
Nein. Alle Assistenten im Speech-to-Speech- und Dualplex™-Modus laufen ab sofort automatisch auf GPT Realtime 2. Es gibt keinen Konfigurationsschalter — das Upgrade ist transparent und rückwärtskompatibel. Bestehende Skripte, Prompts und Tools funktionieren unverändert weiter; Sie sollten lediglich nach dem ersten produktiven Tag stichprobenartig Calls auditieren, um die spürbar bessere Instruction-Following-Qualität zu bestätigen.
Was kostet GPT-5.5 im Pipeline-Modus?
GPT-5.5 ist als Standard-LLM-Option im Pipeline-Modus verfügbar. Die Pricing-Details finden Sie unter famulor.io/de/pricing in der Assistant-Konfiguration je nach gewähltem Voice- und LLM-Stack.
Welche Carrier unterstützt der neue Self-Service-Importer?
Twilio SIP Trunks, Telnyx, Zadarma und DIDLogic. Weitere Carrier können auf Anfrage über Custom-SIP-Konfiguration angebunden werden. Der Wizard ist im Assistant-Setup-Bereich verfügbar.
Was unterscheidet Cartesia Sonic 3.5 von Sonic 3?
Sonic 3.5 klingt natürlicher in langen Calls, ist stabiler bei schwierigen Wörtern und Eigennamen und behält die Stimm-Charakteristik über die volle Anrufdauer. Das Upgrade greift automatisch für alle Cartesia-Voices ohne Konfigurationsänderung.
Wie funktioniert AI-Pause pro Conversation?
Zwei neue API-Endpoints — POST /conversation/{id}/ai-disable und POST /conversation/{id}/ai-enable — schalten die KI-Verarbeitung pro Conversation aus oder an. Das ist ideal für hybride Workflows, in denen ein Mensch zwischenzeitlich übernimmt.
Wird Post-Call-Re-Transkription extra abgerechnet?
Ja. Re-Transkription wird transparent in der Call-Ansicht des betreffenden Calls ausgewiesen, sodass Sie pro Call sehen, ob und wie oft re-transkribiert wurde. Die Abrechnung folgt dem Standard-STT-Pricing Ihres Plans.
Funktioniert Auto-Top-Up auch für Voice Credits?
Aktuell ist Auto-Top-Up für Chat-Credits ausgerollt. Für Voice-Credits ist eine analoge Funktion in der Roadmap. Bis dahin lassen sich Voice-Credits per One-Click oder Abo aufladen.
Ist Split-View für alle Plan-Tiers verfügbar?
Ja. Split-View Detail Panels für Calls und Conversations sind Teil aller Plan-Tiers. Es gibt kein separates Add-On.
Wie migriere ich von Pipeline-Modus auf Dualplex™?
Im Assistant-Editor im Bereich „Architektur" lässt sich der Modus umschalten. Wir empfehlen einen kurzen Test-Run, da Dualplex™ eine andere Konversationsdynamik hat — schneller, mit echtem Turn-Taking. Bei Bedarf hilft unser Support beim Tuning.
Wo finde ich die vollständige Changelog?
Alle Release Notes inklusive älterer Versionen finden Sie auf der Famulor-Blog-Seite sowie im Changelog-Bereich des Help Centers.
















