[Bugfix][KVConnector] Support DCP/PCP in OffloadingConnector by Etelis · Pull Request #41549 · vllm-project/vllm

Etelis · 2026-05-03T11:39:39Z

OffloadingConnector does not work with --decode-context-parallel-size > 1: the engine-core dies on the first request with AssertionError at offloading/scheduler.py:269.

Reproducer (4× H100, single node):

vllm serve Qwen/Qwen2.5-1.5B-Instruct \
  --tensor-parallel-size=4 --decode-context-parallel-size=2 \
  --kv-offloading-size=8 --disable-hybrid-kv-cache-manager \
  --enable-prefix-caching --block-size=16 --enforce-eager
# then: POST /v1/completions with a prompt spanning multiple blocks (~600 tokens)

	Before fix	After fix
First request	`AssertionError` at `scheduler.py:269`, engine-core dies, HTTP 500	HTTP 200, valid completion
`num_blocks` vs `len(offload_keys)`	37 vs 18 (off by ×DCP)	18 vs 18
Multi-shot (3 requests, 601/741/601 tokens, partial prefix overlap)	n/a	All 200 OK; zero `AssertionError`/`ERROR` lines

Multiply OffloadingSpec hash_block_size and gpu_block_size by decode_context_parallel_size * prefill_context_parallel_size to match the logical-unit convention used by Request.block_hashes (and already applied in kv_cache_coordinator, single_type_kv_cache_manager, and kv_cache_utils). Closes vllm-project#40992 Signed-off-by: Itay Etelis <itay.etelis@ibm.com>

claude

Claude Code Review

This pull request is from a fork — automated review is disabled. A repository maintainer can comment @claude review to run a one-time review.

gemini-code-assist

Code Review

This pull request updates the KV offload base class to scale the hash and GPU block sizes by a context parallel factor derived from the parallel configuration. I have no feedback to provide.

orozery

Thanks @Etelis !

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com>

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: hongbolv <33214277+hongbolv@users.noreply.github.com>

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com> Signed-off-by: Ifta Khairul Alam Adil <ikaadil007@gmail.com>

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com> Signed-off-by: Libin Tang <libin.tang@intel.com>

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com>

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com> Signed-off-by: Matt Van Horn <455140+mvanhorn@users.noreply.github.com>

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com>

Cherry-pick 62 bugfix/security PRs from upstream vllm-project/vllm main (2026-05-03 to 2026-06-17), covering scheduler, engine core, model runner, worker, attention, KV cache, compilation, and structured output fixes. Security (4): vllm-project#43286 vllm-project#44744 vllm-project#45118 vllm-project#45252 Bugfix (56): vllm-project#35536 vllm-project#36616 vllm-project#38895 vllm-project#39155 vllm-project#39324 vllm-project#39562 vllm-project#39805 vllm-project#40398 vllm-project#40726 vllm-project#40727 vllm-project#40737 vllm-project#40749 vllm-project#40961 vllm-project#41119 vllm-project#41133 vllm-project#41233 vllm-project#41237 vllm-project#41411 vllm-project#41496 vllm-project#41549 vllm-project#41674 vllm-project#41873 vllm-project#41895 vllm-project#42040 vllm-project#42112 vllm-project#42289 vllm-project#42479 vllm-project#42585 vllm-project#42692 vllm-project#42706 vllm-project#42709 vllm-project#42739 vllm-project#42967 vllm-project#43001 vllm-project#43079 vllm-project#43125 vllm-project#43160 vllm-project#43616 vllm-project#43669 vllm-project#43719 vllm-project#43768 vllm-project#43808 vllm-project#43961 vllm-project#43982 vllm-project#43988 vllm-project#43998 vllm-project#44057 vllm-project#44560 vllm-project#44574 vllm-project#44568 vllm-project#44603 vllm-project#44744 vllm-project#45195 vllm-project#45345 vllm-project#45383 vllm-project#45487 vllm-project#45564 vllm-project#45673 Runner fix (2): vllm-project#44568 vllm-project#44603 Skipped: vllm-project#43781 (ROCm-specific, not applicable to Ascend NPU) Conflict resolutions: - Manual merge: vllm-project#43286 vllm-project#45118 vllm-project#42112 vllm-project#43160 vllm-project#43719 vllm-project#44560 - Upstream-preferred (-X theirs): vllm-project#43808 vllm-project#43988 vllm-project#42967 vllm-project#35536 vllm-project#45195 - Test files (--theirs): vllm-project#44744 vllm-project#41895 vllm-project#42040 vllm-project#41233 vllm-project#45345 vllm-project#43982 Co-authored-by: GitHub Copilot Signed-off-by: MingqiWang-coder <mingqiwang@hust.edu.cn>

Etelis requested review from ApostaC and orozery as code owners May 3, 2026 11:39

claude Bot reviewed May 3, 2026

View reviewed changes

mergify Bot added v1 bug Something isn't working labels May 3, 2026

gemini-code-assist Bot reviewed May 3, 2026

View reviewed changes

Etelis mentioned this pull request May 3, 2026

[Bug]: v0.19.1 Crash with CUDA invalid argument / Segfault when using KV Offloading + EAGLE3 + Expert Parallel (on 8x H20 141GB) #40259

Open

1 task

orozery approved these changes May 4, 2026

View reviewed changes

orozery added the ready ONLY add when PR is ready to merge/full CI is needed label May 4, 2026

Etelis added 2 commits May 4, 2026 21:37

Merge branch 'main' into kv-offload-dcp-pcp

4645fe1

Merge branch 'main' into kv-offload-dcp-pcp

4721675

orozery merged commit 98661fe into vllm-project:main May 5, 2026
49 checks passed

chaojun-zhang pushed a commit to chaojun-zhang/vllm that referenced this pull request May 6, 2026

[Bugfix][KVConnector] Support DCP/PCP in OffloadingConnector (vllm-pr…

836ef6c

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com>

weifang231 pushed a commit to weifang231/eb-vllm that referenced this pull request May 13, 2026

[Bugfix][KVConnector] Support DCP/PCP in OffloadingConnector (vllm-pr…

6ab18eb

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com>

H100-H200-B200 mentioned this pull request May 18, 2026

[MP][Feat] Support DeepSeek V4 LMCache/LMCache#3171

Merged

2 tasks

mfylcek pushed a commit to mfylcek/vllm that referenced this pull request May 19, 2026

[Bugfix][KVConnector] Support DCP/PCP in OffloadingConnector (vllm-pr…

2170761

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com>

jhu960213 pushed a commit to jhu960213/vllm that referenced this pull request May 20, 2026

[Bugfix][KVConnector] Support DCP/PCP in OffloadingConnector (vllm-pr…

36d87fd

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com>

tunglinwood pushed a commit to tunglinwood/vllm that referenced this pull request Jun 22, 2026

[Bugfix][KVConnector] Support DCP/PCP in OffloadingConnector (vllm-pr…

9696022

…oject#41549) Signed-off-by: Itay Etelis <itay.etelis@ibm.com> Co-authored-by: Itay Etelis <itay.etelis@ibm.com>

MingqiWang-coder mentioned this pull request Jul 1, 2026

[Sync] Upstream V1 engine core — 89 PRs (bugfix, scheduler, runner, worker, hardware) vLLM-HUST/vllm-hust#82

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

[Bugfix][KVConnector] Support DCP/PCP in OffloadingConnector#41549

[Bugfix][KVConnector] Support DCP/PCP in OffloadingConnector#41549
orozery merged 3 commits into
vllm-project:mainfrom
Etelis:kv-offload-dcp-pcp

Etelis commented May 3, 2026

claude Bot left a comment

gemini-code-assist Bot left a comment

orozery left a comment

Uh oh!

Labels

3 participants

Uh oh!

Uh oh!

Conversation

Etelis commented May 3, 2026

claude Bot left a comment

Choose a reason for hiding this comment

Claude Code Review

gemini-code-assist Bot left a comment

Choose a reason for hiding this comment

Code Review

orozery left a comment

Choose a reason for hiding this comment

Uh oh!

Labels

3 participants