bert-base-movie

这是一个使用bert-base-chinese在豆瓣影评上微调后的embedding模型。

示例

这是一个自定义示例:

import torch
from transformers import BertTokenizer, BertForMaskedLM

model_name = "ronniewy/bert-base-movie"  # 请将此替换为您的实际模型名称
tokenizer = BertTokenizer.from_pretrained(model_name)
model = BertForMaskedLM.from_pretrained(model_name)

input_text_list = ["就是一部[MASK]片,打戏挺燃,但是故事一般。"]
for input_text in input_text_list:
    inputs = tokenizer(input_text, return_tensors="pt")
    outputs = model(**inputs)
    predictions = outputs.logits.argmax(dim=-1)

    # 替换原始文本中的[MASK]
    mask_index = torch.nonzero(inputs["input_ids"][0] == tokenizer.mask_token_id).item()
    predicted_token = tokenizer.decode(predictions[0][mask_index])
    predicted_text = input_text.replace(tokenizer.mask_token, predicted_token)

    print(predicted_text)  # 就是一部爽片,打戏挺燃,但是故事一般。