当前位置: 首页 > news >正文

Pytorch Bert 中文分类 运行代码时候遇到的问题

问题1 bert = AutoModel.from_pretrained('bert-base-chinese')

报错信息如下: 

RuntimeError: Error(s) in loading state_dict for BertModel:
    size mismatch for bert.embeddings.word_embeddings.weight: copying a param with shape torch.Size([21128, 768]) from checkpoint, the shape in current model is torch.Size([119547, 768]).

后来发现因为以前用的模型版本和token啥的不是一套,所以需要重新下载。

下载地址: bert-base-chinese at main (huggingface.co)

问题2  compute_class_weight('balanced', np.unique(y_train), y_train)

报错  compute_class_weight() takes 1 positional argument but 3 were given

解决方案: compute_class_weight('balanced', classes=np.unique(y_train), y=y_train)

问题3 for batch in tqdm(trainloader):

AttributeError: 'tqdm_notebook' object has no attribute 'disp'

解决方案: pip install ipywidgets

 

相关文章:

  • 设计模式-13 - Prototype Design Pattern 原型设计模式
  • error和exception的区别?
  • Jmeter接口测试之参数化
  • 拼多多流量推广和点击哪个好?拼多多自然流量规则
  • Typescript 哲学 - ts模块使用最佳实践
  • Unity自定义动画-Animation动画数据-How is “fileIDToRecycleName“ generated
  • 【Python从入门到进阶】49、当当网Scrapy项目实战(二)
  • 【AIGC】基于深度学习的图像生成与增强技术
  • uniapp的扩展组件uni-popup 弹出层自动打开
  • docker小知识:linux环境安装docker
  • 协议-http协议-基础概念01-发展历程-http组成-http是什么-相关的应用-相关的协议
  • from tensorflow.keras.layers import Dense,Flatten,Input报错无法引用
  • 计算机毕业设计Java点播影院运营系统(源码+系统+mysql数据库+lw文档)
  • 论文阅读-ATLAS: A Sequence-based Learning Approach for Attack Investigation
  • 社区系统项目复盘-8
  • 校园论坛(Java)—— 数据报表模块
  • 《MySQL实战45讲》——学习笔记19 “SQL查一行执行慢的排查、锁等待/一致性读“【建议收藏】
  • ica1靶机(hydra爆破)
  • 一次性分清zip、gzip、bzip2、tar命令
  • Python源码剖析1-整数对象PyIntObject
  • 【论文笔记】Radatron: Accurate Detection Using Multi-Resolution Cascaded MIMO Radar
  • 网课题库接口调用方法
  • [附源码]计算机毕业设计大学生心理健康测评系统
  • Blackmagic黑魔法摄像机braw视频文件修复方法
  • 【怎么理解回流与重绘?以及触发场景】
  • Java项目:SSM共享汽车租赁平台
  • Spring框架(十一):手动实现一个@Component,讲一讲Spring的工厂后处理器
  • 集合java
  • MAML:User Diverse Preference Modeling by Multimodal AttentiveMetric Learning
  • 基于MATLAB的一级倒立摆控制仿真,带GUI界面操作显示倒立摆动画,控制器控制输出
  • qt人员管理模块(模块化程序)功能块复制直接使用不冲突
  • 【算法】排序——希尔排序