Bauen Sie auf der Grundlage des großen KI-Modells empfindliche emotionale Interaktionen auf, die von Verbrauchern wahrgenommen werden können
Durch die Berührungssensoren, Mikrofone, Kameras und Infrarot-Erkennungssensoren, die den Kopf bedecken und umgekehrt kann es die Umgebung wahrnehmen und mit der Umgebung interagieren.
Fusion von Spracheingabe und visueller Eingabe (mit Schwerpunkt auf statischen Frames) unter Verwendung eines „Text-Bild-Multimodals“.
großes Modell“ zur Ausgabe von Gesprächen
Infrarot-Erkennungssensoren und Mikrofone erfassen biologische Aktivitäten und interagieren aktiv mit ihnen
Benutzer
Multimodale emotionale Ausdrucksausgabe durch Körper- und Handschrittmotoren, LCD-Display (Augen) und Lautsprecher
Schreibtisch, Nachttisch, Umarmung
Relativ fester Standort, geringe Mobilitätsanforderungen, langfristige Verbindung zum Ladegerät
| ASR + LLM Visuelles Bildverständnis Berühren Sie Ereignisse Infrarot-Timer Dialoggedächtnis Charaktereinstellungen |
| Vernetzte cloudbasierte Großmodellplattform (Multimodale Wahrnehmung, großes Sprachmodell, Konversationsgedächtnis, Netzwerkabfrage) |
| Multimodale Wahrnehmungs- und Kontrollsystemschicht | |||
| SzenenverständnisTrigger-Steuerung | Lichtsteuerung | Motorsteuerung | Anzeigesteuerung |
| Hardware-Einbettungsschicht (Roboterkörper) | ||||
Szene
VerständnisTrigger-Steuerung |
Anzeige
Kontrolle |
Motorsteuerung |
Anzeige
Kontrolle |
Anzeige
Kontrolle |
| Gerät | Spezifikationen/Funktionen |
| Mikrofon | Unterstützt Fernfeld-Spracherkennung (5-Meter-Reichweite) und gerichtete Tonaufnahme für den Empfang Sprachbefehle. |
| Kamera | Wird zur Umgebungs- und Objekterkennung verwendet. |
| Infrarotsensor | Wird zum Aufwecken mit geringem Stromverbrauch verwendet, das durch den menschlichen Körper/Haustier ausgelöst wird. |
| Schrittmotor | Verteilte Touchmodule (Kopf, Rücken, Bauch) werden zur Erkennung von Streicheln und Streicheln (z. B „den Kopf berühren“ und „kitzeln“). |
| Schwerkraftsensor | Spüren Sie den Bewegungszustand des Körpers und lösen Sie ein „Notsignal“ aus (z. B. eine Sprachnachricht „Ich bin gefallen“. und es tut weh"), wenn das Produkt herunterfällt. |
| Gerät | Spezifikationen/Funktionen |
| LCD-Ausdrucksbildschirm | 4,28-Zoll-LCD-Bildschirm (Augen), unterstützt dynamische Ausdrucksanzeige und binokulare Anzeige (z. B visuelles Feedback, wenn man sich „tot stellt“ oder „süß benimmt“). |
| Lautsprecher | Mono/4Ω, 5W Breitbandlautsprecher (z. B. Sprachausgabe beim „Singen eines Liedes“ oder „Erzählen eines Witzes“). |
| Vollfarbige LED-Lichtleisten | Farbige Lichtstreifen, die relevante „emotionale“ Lichteffekte abspielen oder als solche verwendet werden können Kontrollleuchten. |
| Gerät | Spezifikationen/Funktionen |
| Schrittmotor | Doppelmotoren zum Winken und Drehen des Kopfes (Taille) |
| Gerät | Spezifikationen/Funktionen |
| Hauptsteuerchip | Umweltwahrnehmung: hat die Fähigkeit, Stürze zu spüren und visuell wahrzunehmen; |
| WLAN / Bluetooth | 2,4G WLAN + Bluetooth |
| Lagereinheit | NAND-FLASH 256 MB, 64 MB DRAM |
| Gerät | Spezifikationen/Funktionen |
| Lithiumbatterie | 3000 mAh Kapazität/7,2 V, unterstützt schnelles Laden, 2 Stunden Akkulaufzeit und 2 Tage umfassender Standby; Ausgestattet mit einem Leistungserkennungschip. |
| Aufladung | USB Typ-C |
| Zubehörmodule | Verschiedene Kleidungsstile und Accessoires können geändert werden |
| wütend | verdreht die Augen | schwach | bleib cool |
| Begeisterung | traurig | unangenehm | schüchtern |
| laut lachen | lächeln | Herzaugen | stehen zu |
| schlafen | Niedlich | Unrecht getan | Sun Wukong |
| Benommenheit | neugierig | schielen | teuflisch |