gemma3-vllm-stack/model.env.example at ef8537e923dc401c93e8252b3884b52a22dd69d3 - gemma3-vllm-stack - Gitea: Git with a cup of tea

git/gemma3-vllm-stack

Files

Raghav ef8537e923 Initial production-ready Gemma 3 vLLM ROCm stack

Co-Authored-By: Oz <oz-agent@warp.dev>

2026-04-18 22:53:46 +05:30

8 lines

231 B

Plaintext

Raw Blame History

 HF_TOKEN=YOUR_HF_TOKEN_HERE
 VLLM_API_KEY=YOUR_LOCAL_API_KEY_HERE
 GEMMA_MODEL_ID=google/gemma-3-1b-it
 BACKEND_PORT=8000
 HUGGINGFACE_CACHE_DIR=/home/${USER}/.cache/huggingface
 VLLM_MAX_MODEL_LEN=4096
 VLLM_GPU_MEMORY_UTILIZATION=0.88