matsuolab-weblab-10b-instruction-sft-gguf
matsuo-labさんが公開しているweblab-10b-instruction-sftのggufフォーマット変換版です。
llama.cppのexamplesで動かせます。 llama.cpp本家は開発速度が早く、clone先をブランチに変更しました。
Usage (試用)
git clone --branch mmnga-dev https://github.com/mmnga/llama.cpp.git
cd llama.cpp
make -j
./gptneox -m 'matsuolab-weblab-10b-instruction-sft-q4_0.gguf' -n 128 -t 8 -p '以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。\n\n### 指示:\n大規模言語モデルについて説明してください。\n\n### 応答:'