LLMs & Embedding Modelle

Large Language Modelle und Embeddings

Wir stellen eine OpenAI-kompatible Modelloberfläche bereit. Auf dieser Seite stehen bewusst nur die Informationen, die Nutzer direkt brauchen: der Model-Parameter für den Client, das tatsächlich dahinterliegende Zielmodell, der Host-Typ myLab THL | GWDG und die wichtigsten Limits.

Setze im OpenAI-Client die base_url auf den Modell-Proxy https://models.mylab.th-luebeck.de/v1 und verwende einen Dummy-API-Key.

~~Hinweils~~Hinweis GWDG-Rate-Limits >>>>>>>>>>>>>>>>>>TODO

Chat generische Aliasse

Modellparameter	Zielmodell	myLab THL \| GWDG	API	Hinweise
`chat-small`	`qwen3-vl-8b`	THL	`chat/completions`	40.960 Kontext, max. 2 Bilder
`chat-default`	`gpt-oss-120b`	GWDG	`chat/completions`, `completions`	Standardalias; beide Chat-Endpunkte vorhanden
`chat-medium`	`gpt-oss-120b`	GWDG	`chat/completions`, `completions`	Gleiche Backend-Zuordnung wie `chat-default`
`chat-large`	`glm-4.7`	GWDG	`chat/completions`	Größerer Chat-Alias
`chat-xlarge`	`mistral-large-3-675b-instruct-2512`	GWDG	`chat/completions`	Größter Chat-Alias in der GWDG-Gruppe

Chat-VL generische Aliasse

Modellparameter	Zielmodell	myLab THL \| GWDG	API	Hinweise
`chat-vl-small`	`qwen3-vl-8b`	THL	`chat/completions`	40.960 Kontext, max. 2 Bilder
`chat-medium`	`gemma4-31b`	GWDG	`chat/completions`, `completions`	Gleiche Backend-Zuordnung wie `chat-default`
`chat-vl-large`	`qwen3.5-397b-a17b`	GWDG	`chat/completions`	Extern gehostet; Limits im Repo nicht dokumentiert
`chat-vl-xlarge`	`mistral-large-3-675b-instruct-2512`	GWDG	`chat/completions`	Extern gehostet; Limits im Repo nicht dokumentiert

Andere generische Aliasse

Modellparameter	Zielmodell	myLab THL \| GWDG	API	Hinweise
`coder-small`	`qwen3.6-27b`	THL	`chat/completions`	131.072 Kontext, max. 4 Bilder
`coder-large`	`glm-4.7`	GWDG	`chat/completions`	Extern gehostet

Explizite Modellnamen

Modellname	myLab THL \| GWDG	API	Hinweise
`gpt-oss-120b`	GWDG	`chat/completions`, `completions`	Direktname; Kontext im Repo nicht explizit dokumentiert
`glm-4.7`	GWDG	`chat/completions`	Direktname; extern gehostet
`qwen3.5-397b-a17b`	GWDG	`chat/completions`	Direktname; extern gehostet
`mistral-large-3-675b-instruct-2512`	GWDG	`chat/completions`	Direktname; extern gehostet
`qwen3-vl-8b`	THL	`chat/completions`	40.960 Kontext, max. 2 Bilder
`gemma4-31b`	THL	`chat/completions`	131.072 Kontext, max. 4 Bilder
`gemma4-e2b`	THL	`chat/completions`	131.072 Kontext, max. 4 Bilder
`qwen3.6-27b`	THL	`chat/completions`	131.072 Kontext, max. 4 Bilder

Embeddings

Modellparameter	Zielmodell	myLab THL \| GWDG	API	Hinweise
`qwen3-embedding-4b`	`qwen3-embedding-4b`	THL	`embeddings`	TEI-kompatibel; `max-batch-tokens=65536`, `max-client-batch-size=64`

Die Embedding-Modelle können mit der OpenAI-Bibliothek genutzt werden. Wichtig ist auch hier nur der Modell-Parameter; die Proxy-URL bleibt in dieser Wiki-Seite bewusst verborgen.

from openai import OpenAI

client = OpenAI(
    base_url="<Modell-Proxy>/v1",
    api_key="ignored",
)

result = client.embeddings.create(
    model="qwen3-embedding-4b",
    input="Beispieltext",
)

Kurzhinweise

chat-default und chat-medium zeigen auf dasselbe Zielmodell.
chat-small ist unser Chat-VL-Alias für das kleinere Vision-Modell.
Nicht-LLM-Modelle wie OCR, Audio und Bildmodelle stehen auf der Seite Andere Modelle (Image Audio etc).md.