bert-base-movie
这是一个使用bert-base-chinese在豆瓣影评上微调后的embedding模型。
示例
这是一个自定义示例:
import torch
from transformers import BertTokenizer, BertForMaskedLM
model_name = "ronniewy/bert-base-movie" # 请将此替换为您的实际模型名称
tokenizer = BertTokenizer.from_pretrained(model_name)
model = BertForMaskedLM.from_pretrained(model_name)
input_text_list = ["就是一部[MASK]片,打戏挺燃,但是故事一般。"]
for input_text in input_text_list:
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model(**inputs)
predictions = outputs.logits.argmax(dim=-1)
# 替换原始文本中的[MASK]
mask_index = torch.nonzero(inputs["input_ids"][0] == tokenizer.mask_token_id).item()
predicted_token = tokenizer.decode(predictions[0][mask_index])
predicted_text = input_text.replace(tokenizer.mask_token, predicted_token)
print(predicted_text) # 就是一部爽片,打戏挺燃,但是故事一般。