gpt2-xl-sft int8量化,显存占用减少50%