Pull requests · ggml-org/llama.cpp

New pull request New

442 Open 5,612 Closed

documentation

#13440 opened May 10, 2025 by 99991

Loading…

ggml Nvidia GPU

#13439 opened May 10, 2025 by JohannesGaessler

Loading…

ggml Nvidia GPU

#13438 opened May 10, 2025 by JohannesGaessler

Loading…

examples server

#13436 opened May 10, 2025 by aumfer

Loading…

ggml Nvidia GPU

#13435 opened May 10, 2025 by JohannesGaessler

Loading…

examples server

#13429 opened May 10, 2025 by ServeurpersoCom

Loading…

python

#13423 opened May 10, 2025 by CISC

Loading…

ggml SYCL

#13406 opened May 9, 2025 by AD2605

Loading…

Add --disable-op-offload to improve -ot pp perf in MoE models like llama4 400B examples ggml testing

#13386 opened May 8, 2025 by hjc4869

Loading…

ggml SYCL

#13383 opened May 8, 2025 by AD2605

Loading…

ggml Nvidia GPU

#13382 opened May 8, 2025 by yeahdongcn • Draft

gguf-py: Optimize GGUFReader read-only mode performance python

#13378 opened May 8, 2025 by Isotr0py

Loading…

ggml Kompute python SYCL

#13369 opened May 8, 2025 by co63oc

Loading…

devops ggml Nvidia GPU

#13360 opened May 7, 2025 by thevishalagarwal

Loading…

ggml SYCL

#13357 opened May 7, 2025 by EwanC • Draft

ProTip! Type g p on any issue or pull request to go back to the pull request listing page.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Pull requests: ggml-org/llama.cpp

Pull requests list