NVIDIA/TensorRT-LLM

GitHub

github.com

nvidia.github.io

Releases93

Frequency1 week 3 days

Last Release5 days ago

Stars14.2K

TensorRT LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and supports state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT LLM also contains components to create Python and C++ runtimes that orchestrate the inference execution in a performant way.

Subscribe above to receive notifications when new versions are released.

93 releases

Feed

Version	Date	Stability Stability is determined by the version string and may be inaccurate.
v1.3.0rc4	Feb 13, 2026Friday, 13 February 2026, 22:11	RC
v1.3.0rc3	Feb 8, 2026Sunday, 8 February 2026, 14:50	RC
v1.2.0rc6.post3	Feb 4, 2026Wednesday, 4 February 2026, 03:25	RC
v1.2.0rc2.post2	Feb 4, 2026Wednesday, 4 February 2026, 03:24	RC
v1.3.0rc2	Jan 30, 2026Friday, 30 January 2026, 19:06	RC
v1.3.0rc1	Jan 25, 2026Sunday, 25 January 2026, 16:32	RC
v1.2.0rc6.post2	Jan 22, 2026Thursday, 22 January 2026, 04:40	RC
v1.3.0rc0	Jan 18, 2026Sunday, 18 January 2026, 07:34	RC
v1.2.0rc8	Jan 11, 2026Sunday, 11 January 2026, 14:08	RC
v1.2.0rc6.post1	Jan 7, 2026Wednesday, 7 January 2026, 08:55	RC
v1.2.0rc2.post1	Jan 5, 2026Monday, 5 January 2026, 05:20	RC
v1.2.0rc7	Jan 4, 2026Sunday, 4 January 2026, 17:21	RC
v1.2.0rc6	Dec 15, 2025Monday, 15 December 2025, 17:32	RC
v1.1.0	Dec 11, 2025Thursday, 11 December 2025, 15:27	Stable
v1.2.0rc5	Dec 7, 2025Sunday, 7 December 2025, 00:24	RC
v1.2.0rc4	Nov 23, 2025Sunday, 23 November 2025, 03:06	RC
v1.2.0rc3	Nov 20, 2025Thursday, 20 November 2025, 03:01	RC
v1.2.0rc2	Nov 5, 2025Wednesday, 5 November 2025, 06:54	RC
v1.2.0rc1	Oct 19, 2025Sunday, 19 October 2025, 14:19	RC
v1.2.0rc0.post1	Oct 13, 2025Monday, 13 October 2025, 07:19	RC
v1.2.0rc0	Sep 29, 2025Monday, 29 September 2025, 09:39	RC
v1.0.0	Sep 23, 2025Tuesday, 23 September 2025, 15:18	Stable
v1.1.0rc5	Sep 15, 2025Monday, 15 September 2025, 14:13	RC
v1.1.0rc4	Sep 9, 2025Tuesday, 9 September 2025, 07:42	RC
v1.1.0rc2.post2	Sep 9, 2025Tuesday, 9 September 2025, 15:45	RC