LLMs & Embedding Modelle
Large Language Modelle und Embeddings
Wir stellen eine OpenAI-kompatible Modelloberfläche bereit. Auf dieser Seite stehen bewusst nur die Informationen, die Nutzer direkt brauchen: der Model-Parameter für den Client, das tatsächlich dahinterliegende Zielmodell, der Host-Typ myLab THL | GWDG und die wichtigsten Limits.
Setze im OpenAI-Client die
base_urlauf den Modell-Proxyhttps://models.mylab.th-luebeck.dev/v1und verwende einen Dummy-API-Key.Key (nicht leer).
Hinweis
GWDG-GWDG:Einige der Modelle hosten wir nicht mehr selbst, sondern leiten an das GWDG weiter. Die Abrechnung übernehmen wir. Dokumentation dazu seitens des GWDG findet sich hier. Die Modelle sind in den Tabellen unten entsprechend gekennzeichnet.
Achtung: Wir haben sehr restriktive Rate-Limits
>>>>>>>>>>>>>>>>>>TODOfür die gesamte Hochschule erhalten. Es kann daher sein, dass gerade bei vielen Anfragen (auch von anderen Personen) Fehler von der API zurückkommen. Die Rate-Limits sind:Sekunde: 2 Requests Minute: 15 Requests Stunde: 900 Requests Tag: 21k Requests Monat: 350k Requests
Chat generische Aliasse
| Modellparameter | Zielmodell | myLab THL | GWDG | API | Hinweise |
|---|
chat-fast
gemma4-e4b
THL
chat/completions
Kontext 131K, max. 4 Bilder
chat-small
qwen3.5-27b
GWDG
chat/completions
Kontext 256K
chat-default
gpt-oss-120b
GWDG
chat/completions, completions
Standardalias; beide Chat-Endpunkte vorhanden
chat-medium
gpt-oss-120b
GWDG
chat/completions, completions
Gleiche Backend-Zuordnung wie chat-default
chat-large
glm-4.7
GWDG
chat/completions
Größerer Chat-Alias
chat-xlarge
mistral-large-3-675b-instruct-2512
GWDG
chat/completions
Größter Chat-Alias in der GWDG-Gruppe
Chat-VL generische Aliasse
| Modellparameter | Zielmodell | myLab THL | GWDG | API | Hinweise |
|---|---|---|---|---|
chat-vl-fast |
gemma4-e4b
THL
chat/completions
Kontext 131K, max. 4 Bilder
chat-vl-small
qwen3.5-27b
GWDG
chat/completions
Extern gehostet, Kontext 256K, multimodal
chat-vl-medium
gemma4-31b
chat/completions, completions
chat-default4 Bilder
chat-vl-large
qwen3.5-397b-a17b
GWDG
chat/completions
Extern chat-vl-xlarge
mistral-large-3-675b-instruct-2512
GWDG
chat/completions
Extern Andere generische Aliasse
| Modellparameter | Zielmodell | myLab THL | GWDG | API | Hinweise |
|---|---|---|---|---|
coder-small |
qwen3.6-27b |
THL | chat/completions |
131.072 Kontext, max. 4 Bilder |
coder-large |
glm-4.7 |
GWDG | chat/completions |
Extern gehostet |
Explizite Modellnamen
| Modellname | myLab THL | GWDG | API | Hinweise |
|---|---|---|---|
gpt-oss-120b |
GWDG | chat/completions, completions |
Direktname; Kontext im Repo nicht explizit dokumentiert |
glm-4.7 |
GWDG | chat/completions |
Direktname; extern gehostet |
qwen3.5-397b-a17b |
GWDG | chat/completions |
Direktname; extern gehostet |
mistral-large- |
GWDG | chat/completions |
Direktname; extern gehostet |
gemma4-31b |
THL | chat/completions |
131.072 Kontext, max. 4 Bilder |
gemma4- |
THL | chat/completions |
131.072 Kontext, max. 4 Bilder |
qwen3.6-27b |
THL | chat/completions |
131.072 Kontext, max. 4 Bilder |
Embeddings
| Modellparameter | Zielmodell | myLab THL | GWDG | API | Hinweise |
|---|---|---|---|---|
qwen3-embedding-4b |
qwen3-embedding-4b |
THL | embeddings |
TEI-kompatibel; max-batch-tokens=65536, max-client-batch-size=64 |
Die Embedding-Modelle können mit der OpenAI-Bibliothek genutzt werden. Wichtig ist auch hier nur der Modell-Parameter; die Proxy-URL bleibt in dieser Wiki-Seite bewusst verborgen.
from openai import OpenAI
client = OpenAI(
base_url="<Modell-Proxy>/v1",
api_key="ignored",
)
result = client.embeddings.create(
model="qwen3-embedding-4b",
input="Beispieltext",
)
Kurzhinweise
chat-defaultundchat-mediumzeigen auf dasselbe Zielmodell.chat-smallist unser Chat-VL-Alias für das kleinere Vision-Modell.- Nicht-LLM-Modelle wie OCR, Audio und Bildmodelle stehen auf der Seite
Andere Modelle (Image Audio etc).md.