labels: ['date', 'project_name', 'project_type', 'construction_unit','implementation_organization', 'project_department', 'project_manager','subcontractor', 'team_leader', 'risk_level','page'] # 类别名称 # Model configuration for selecting the pretrained model and other model-related settings model_args: # 使用的预训练模型的路径,可以是模型名称如 'uie-base' 或者一个自定义路径 model_name_or_path: "uie-base" # 导出推理模型的路径,如果为空,则默认使用训练输出目录下的 'export' 文件夹 export_model_dir: null # 是否使用多语言模型(默认为 false,如果是多语言模型,设为 true) multilingual: false # Data configuration for specifying the paths to the training and validation datasets data_args: # 训练数据的路径,可以是一个文件路径或者包含文本的文件 train_path: "E:\\workingSpace\\PycharmProjects\\Intention_dev\\uie\\data\\train.json" # 验证数据的路径 dev_path: "E:\\workingSpace\\PycharmProjects\\Intention_dev\\uie\\data\\val.json" # 最大序列长度,用于对输入数据进行截断或填充 max_seq_length: 512 # 动态最大序列长度,若为空则按标准 max_seq_length,若提供则按 batch 设置不同的最大长度 dynamic_max_length: [16, 32, 64, 128] # 可设为不同长度,例如 16、32、64、128 等 # Training configuration for specifying training-related settings training_args: # 训练设备,可以是 'cpu', 'gpu' 或 'npu' device: "gpu" # 每 10 步输出一次日志 logging_steps: 10 # 每 2000 步进行一次评估 eval_steps: 2000 # 每 2000 步保存一次模型 save_steps: 2000 # 随机种子,确保每次训练的随机性一致 seed: 1000 # 输出目录,保存模型和日志 output_dir: "./output" # 每个设备上的训练批大小 per_device_train_batch_size: 16 # 每个设备上的评估批大小 per_device_eval_batch_size: 16 # 训练轮数 num_train_epochs: 10 # 学习率 learning_rate: 1e-5 # 是否进行训练 do_train: true # 是否进行评估 do_eval: true # 是否导出推理模型 do_export: true # 是否覆盖输出目录,如果为 true,将清空输出目录并从头开始训练 overwrite_output_dir: true # 是否禁用 TQDM 进度条 disable_tqdm: false # 用于评估最佳模型的指标,可以是 'eval_loss' 或 'eval_f1' 等 metric_for_best_model: "eval_f1" # 训练结束后加载最佳模型 load_best_model_at_end: true # 保留最新的模型检查点的最大数量 save_total_limit: 3