llmcompressor.modeling.deepseek_v3

Classes:

CalibrationDeepseekV3MoE –

Calibration version of DeepseekV3MoE that sends all tokens to all experts.

CalibrationDeepseekV3MoE

CalibrationDeepseekV3MoE(
    original: DeepseekV3MoE,
    config: DeepseekV3Config,
    calibrate_all_experts: bool = True,
)

Bases: MoECalibrationModule

Calibration version of DeepseekV3MoE that sends all tokens to all experts.

Source code in llmcompressor/modeling/deepseek_v3.py

def __init__(
    self,
    original: OriginalDeepseekV3MoE,
    config: DeepseekV3Config,
    calibrate_all_experts: bool = True,
):
    super().__init__()
    self.config = config
    self.experts = original.experts
    self.gate = original.gate
    self.shared_experts = original.shared_experts
    self.calibrate_all_experts = calibrate_all_experts