Set generation config defaults according to decoding method #3774

mzegla · 2025-11-06T13:13:36Z

No description provided.

Copilot

Pull Request Overview

This PR implements automatic default parameter setting for assisted decoding methods (Speculative Decoding and Prompt Lookup) when parameters are not explicitly provided in requests. Previously, missing parameters caused execution errors; now, sensible defaults are applied based on the detected decoding method.

Key changes:

Added DecodingMethod enum and automatic detection logic to identify pipeline configuration (standard, speculative decoding, or prompt lookup)
Implemented adjustConfigForDecodingMethod() to set default values (num_assistant_tokens=5, max_ngram_size=3) when parameters are missing
Updated tests to verify that missing parameters now result in successful execution with defaults instead of errors

Reviewed Changes

Copilot reviewed 13 out of 13 changed files in this pull request and generated 3 comments.

Show a summary per file

File	Description
src/llm/io_processing/base_generation_config_builder.hpp	Added `DecodingMethod` enum and `adjustConfigForDecodingMethod()` method declaration
src/llm/io_processing/base_generation_config_builder.cpp	Implemented default parameter logic for different decoding methods
src/llm/io_processing/generation_config_builder.hpp	Updated constructor signature and added method to adjust config for decoding method
src/llm/servable.hpp	Added `decodingMethod` field and `determineDecodingMethod()` method declaration
src/llm/servable.cpp	Implemented decoding method detection based on plugin configuration
src/llm/servable_initializer.cpp	Added call to determine decoding method during servable initialization
src/llm/language_model/legacy/servable.cpp	Updated to pass decoding method and call adjustment method
src/llm/visual_language_model/legacy/servable.cpp	Updated to pass decoding method and call adjustment method
src/llm/io_processing/llama3/generation_config_builder.hpp	Updated constructor to accept decoding method parameter
src/llm/io_processing/hermes3/generation_config_builder.hpp	Updated constructor to accept decoding method parameter
src/llm/io_processing/phi4/generation_config_builder.hpp	Updated constructor to accept decoding method parameter
src/test/llm/assisted_decoding_test.cpp	Added tests for default parameter behavior and updated expectations from error to success
docs/model_server_rest_api_chat.md	Documented default parameter values for assisted decoding methods

💡 Add Copilot custom instructions for smarter, more guided reviews. Learn how to get started.

src/llm/io_processing/base_generation_config_builder.cpp

src/llm/servable.cpp

mzegla added 2 commits November 5, 2025 11:45

init

47c28f0

major change

79f4405

mzegla requested a review from Copilot November 6, 2025 13:13

Copilot AI reviewed Nov 6, 2025

View reviewed changes

src/llm/io_processing/base_generation_config_builder.cpp Show resolved Hide resolved

src/llm/io_processing/base_generation_config_builder.cpp Show resolved Hide resolved

src/llm/servable.cpp Show resolved Hide resolved

mzegla requested review from dkalinowski, dtrawins and ngrozae November 6, 2025 13:16

dkalinowski reviewed Nov 7, 2025

View reviewed changes

src/llm/servable.cpp Show resolved Hide resolved

dtrawins added this to the 2025.4rc milestone Nov 7, 2025

dkalinowski approved these changes Nov 7, 2025

View reviewed changes

mzegla requested a review from michalkulakowski November 12, 2025 13:58

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Set generation config defaults according to decoding method #3774

Set generation config defaults according to decoding method #3774

Uh oh!

mzegla commented Nov 6, 2025

Uh oh!

Copilot AI left a comment

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

Set generation config defaults according to decoding method #3774

Are you sure you want to change the base?

Set generation config defaults according to decoding method #3774

Uh oh!

Conversation

mzegla commented Nov 6, 2025

Uh oh!

Copilot AI left a comment

Choose a reason for hiding this comment

Pull Request Overview

Reviewed Changes

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants