llama.rust

LLM inference in Rust

Components

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
all-close		all-close
flash-attention		flash-attention
inference		inference
kv-cache		kv-cache
linear-attention		linear-attention
multihead-attention		multihead-attention
paged-attention		paged-attention
python		python
round-multiple		round-multiple
scaled-dot-product-attention		scaled-dot-product-attention
sigmoid		sigmoid
.gitignore		.gitignore
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md