Direkt zum Hauptinhalt

Allgemeines

Wir hosten generative KI KI-Modelle für Lehre, Forschung und Transfer.

Für die Dauer des Projekts HI-Lübeck (Innovative Hochschule) hostenbetreiben wir diese Modelle als Teil der Campus-Plattform für Transferzwecke ohne Zugangsbeschränkungen.Zugangsbeschränkung. WirDamit wollen damitwir Innovationen im Bereich der DigitaliserungDigitalisierung und der Nutzung von Generativergenerativer KI auf dem Hanse-Innovation-Campus fördern.

Betriebsprinzipien:

  1. Wir betreiben alledie hieröffentlich aufgeführtendokumentierten generativen KI-Modelle auf Servern auf dem Campus der TH-Lübeck.Lübeck oder bei externen Partnern über den Modell-Proxy.
  2. Wir speichern dieverarbeitete verarbeiteten DatenInhalte nicht dauerhaft und verwenden sie nicht für interne Zwecke.
  3. Wir speichern generierte Daten nur für die Dauer der VerarbeitungVerarbeitung, einschließlich derdirekt inanschließender transaktionalerProzesse Kausalitätwie anschließenden Verarbeitungsprozesse (z.B.ein Download eines generierten Bildes nach dessen Generierung).Bildes.
  4. Wir protokollieren nur DatenmengenMengen- (z.B.und Anzahl der Requests, Anzahl der Token),Betriebsdaten, aber keine Dateninhalte (z.B. verarbeiteter Text, der in ein Sprachmodell einfließt,Eingabe- oder generierter Text, der von einem Sprachmodell generiert wird).Ausgabedateninhalte.
  5. AlleDie hier genannten KI-Modelle dürfensind nicht für kommerzielle Dienstleistungen verwendet werden (sie dienen ausschließlich der explorativen Analyse potenzieller Anwendungsfälle und sonstiger betrieblicher Fragestellungen).vorgesehen.

Wartungsfenster

NEU Jeweils am 2. Donnerstag eines Monats werden ab 20 Uhr die Systeme des myLab aktualisiert.
Auch die hier genannten Modelle können davon betroffen sein und sind daher ggf. in diesen Zeiträumen nicht erreichbar! {.is-warning}

NewsletterModellübersichten

Die

Ineigentlichen unseremModelltabellen Chatbotliegen KIRA findet ihr das Anmeldeformular fürin den Newsletter:
chat.kira.th-luebeck.dev
Wir informieren euch dann per Mail, wenn wir an den gehosteten Modellen etwas ändern.

Large LanguageDetailseiten und Embeddingsind dort nach Aliasen, Zielmodellen und Host-Typen aufgeteilt.

    LLMs_+_Embedding_Modelle.md – Chat-Modelle, Vision-Modelle und Embeddings Andere Modelle (Image Audio etc).md – Audio, OCR und Bildmodelle

    OpenAI-kompatibler Modell-Proxy

    Wir hostenstellen verschiedeneeine Language Models. Für Details siehe LLM-Übersicht

    Unser ChatBot KIRA läuft bspw. auf Llama3 70B.

    Andere Modelle (Audio, Images)

    Wir hosten auch andere Modelle, z.B. für Sprach- und Bildgenerierung. Für Details siehe Andere Modelle

    openAI ClientOpenAI-kompatible API (Beta)

    bereit.

    Wir hosten ab sofort eine OpenAI Client kompatible API. DieseSie befindet sich nochweiterhin im regulären Betrieb, die konkreten Modelle und Limits stehen jedoch ausschließlich in derden Erprobung und es kann entsprechend zu Ausfällen kommen. Erreichbar ist diese unter models.mylab.th-luebeck.dev
    Über die API sind alle unsere LLMs und auch weitere Modelle erreichbar.Detailseiten.

    Bei der Verwendung des openAI OpenAI-Clients z.B. in Python muss die base_url auf https://models.mylab.th-luebeck.dev/v1den gesetztModell-Proxy werden.zeigen; der API-Key kann ein Dummy-Wert sein.

    EineDie Übersichtwichtigsten allerNutzungsregeln:

    Modelle
    findetmodel sichim Client ist immer der sichtbare Alias aus den Tabellen. Das hinterlegte Zielmodell steht in der KI-PlattformSpalte ÜbersichtZielmodell. (Lädt ggf

    Schnellnavigation

    etwas
    langsam).Chat,
    Chat-VL

    Alleund nicht-LLMEmbeddings: LLMs_+_Embedding_Modelle.md

    Audio, OCR und Bilder: Andere Modelle müssen(Image derzeitAudio alsetc).md "Highly Experimental" betrachtet werden. Wir garantieren keine Verfügbarkeit oder Qualität.

    Übersicht der verfügbaren Modelle

    Die Verwendung der gelisteten Endpunkte kann der regulären openAI Dokumentation entnommen werden.

    Model Parameter openAI API-Endpoints Actual Model Backend Anmerkungen gpt-4o-mini v1/chat/completions phi-4-multimodal vLLM - phi-4-multimodal v1/chat/completions Qwen3 VL 8B vLLM Wird zum 30.11. abgeschalten, verweist in der Übergangszeit noch auf das Qwen3 VL 8B qwen3-vl-8b v1/chat/completions Qwen3 VL 8B vLLM - qwen3-vl-32b v1/chat/completions Qwen3 VL 32B vLLM - chat-large v1/chat/completions
    v1/completions gpt-oss-120b vLLM - chat-default v1/chat/completions
    v1/completions gpt-oss-120b vLLM - gpt-oss-120b v1/chat/completions
    v1/completions gpt-oss-120b vLLM - nanonets-ocr2-3b v1/chat/completions nanonets-ocr2-3b vLLM - tts-1-hd v1/audio/speech coqui xtts-v2 customized matatonic/openedai-speech - xtts-v2 v1/audio/speech coqui xtts-v2 customized matatonic/openedai-speech - whisper-3-large v1/audio/transcriptions
    v1/audio/translations whisper-3-large customized matatonic/openedai-whisper - whisper-1 v1/audio/transcriptions
    v1/audio/translations whisper-3-large customized matatonic/openedai-whisper - dall-e-3 v1/images/generations
    v1/images/edits
    v1/images/variations
    v1/images/data Flux.1-Dev hanseware/FastFusion - flux.1-dev v1/images/generations
    v1/images/edits
    v1/images/variations
    v1/images/data Flux.1-Dev hanseware/FastFusion - flux.1-kontext v1/images/edits
    v1/images/variations
    v1/images/data Flux.1-Kontext hanseware/FastFusion - qwen3-embedding-4b v1/embeddings qwen3-embedding-4b Huggingface TEI -