Digitale Bauen eines Zuhörer-Bots

Titel: Entwicklung eines „Zuhörer-Bots“ (Telefonie) mit Pausenerkennung (Twilio/Python/Node.js) Zusammenfassung: Ich suche einen Entwickler, um einen MVP (Minimum Viable Product) für einen Telefon-Service zu bauen. Das Ziel ist ein „digitaler Zuhörer“. Nutzer rufen eine Nummer an, um ihren Frust abzulassen. Das System soll zuhören und in den Gesprächspausen automatisch bestätigende Standard-Phrasen abspielen. Der Clou: Wir benötigen für diese Phase keine generativa AI (LLM). Es geht rein um Audio-Handling und Logik. Funktionsablauf (User Flow): Anruf: Der Nutzer wählt die Nummer. Begrüßung: Das System hebt ab und spielt ein kurzes Intro (z.B. „Lass alles raus, ich höre zu.“). Loop (Die Kernfunktion): Das System „hört zu“ (Voice Activity Detection / VAD). Sobald der Nutzer aufhört zu sprechen (Stille > z.B. 700ms), wählt das System zufällig eine Audio-Datei aus einem Pool von ca. 20–50 vorproduzierten Antworten (z.B. „Ja“, „Verstehe“, „Das ist ja blöd“). Wichtig: Die Antworten sollen rotieren, damit es sich natürlich anfühlt (keine direkte Wiederholung derselben Datei). Ende: Wenn der Nutzer auflegt, wird der Anruf beendet. Technische Anforderungen: Plattform: Bevorzugt Twilio (Programmable Voice) oder vergleichbare VoIP-Dienste. Sprache: Python, Node.js oder eine No-Code Lösung, die diese Logik abbilden kann. Hosting: Das Skript sollte auf einem einfachen Cloud-Server (AWS, Heroku, DigitalOcean) oder als Serverless Function laufen. Audio-Management: Einfaches Hinzufügen neuer MP3-Dateien zum „Antwort-Pool“ sollte möglich sein. Lieferumfang (Deliverables): Der funktionierende Quellcode. Einrichtung auf meinem Twilio-Account (oder Anleitung dazu). Dokumentation, wie ich die Audio-Dateien austauschen kann. Nice-to-have (Optional für später): Struktur so anlegen, dass wir später einfach auf eine echte KI (OpenAI Realtime API) umschalten können (Upgrade-Pfad).

Регистрация