Ner_docs.md

# sent_id = 0
SOCCER O
- O
JAPAN B-LOC
GET O
LUCKY O
WIN O
, O
CHINA B-LOC
IN O
SURPRISE O
DEFEAT O
. O

# sent_id = 1
Nadim B-PER
Ladki I-PER
...
"data": {
    "use_char_level_embeddings": true,
    "use_start_end_token": true,
    "tokenize_entities": true,
    ... # other parameters
        }
...
"model": {
    "bert_embedder": {
        "pretrained_model_name": "allegro/herbert-base-cased", # or any other mode from huggingface
        "pretrained_model_type": "AutoModel",
        "projection_dimension": None,
        "freeze_bert": True,
        "token_pooling": True,
        "pooling_strategy": "max"
                     },
    "char_embedder": {"type" : "combo",
                      "char_embedding_dim":  64
                     },
    "classifier": {"type" : "crf",
                   "to_tag_space" :  "bilstm"},
    "dropout": 0.1
            },
...
{
 "data": {
   "path_data": "./data/pl/",
   "use_char_level_embeddings": true,
   "use_start_end_token": true,
   "tokenize_entities": true,
   "batch_size": 32,
   "encoding": "utf-8",
   "num_workers": 1
 },

 "model": {
   "bert_embedder": {
       "pretrained_model_name": "allegro/herbert-base-cased",
       "pretrained_model_type": "AutoModel",
       "projection_dimension": null,
       "freeze_bert": true,
       "token_pooling": true,
       "pooling_strategy": "max"
                    },
   "char_embedder": {"type" : "combo",
                     "char_embedding_dim":  64
                    },
   "classifier": {"type" : "crf",
                  "to_tag_space" :  "bilstm"},
   "dropout": 0.1
           },

 "loss": "ce",
 "learning_rate": 0.001,

 "callbacks": {"FixedProgressBar": true,
               "LearningRateMonitor": {"logging_interval":"epoch"},
               "ModelCheckpoint": {"monitor": "validation_f1",
                                   "mode": "max",
                                   "save_top_k": 1,
                                   "save_weights_only": true,
                                   "filename" : "best_model"},
               "EarlyStopping": {"monitor": "validation_f1",
                                 "mode": "max",
                                 "min_delta": 0.001,
                                 "patience": 6}},

 "trainer": {"devices": [0],
             "max_epochs": 50,
             "accelerator": "cuda",
             "log_every_n_steps": 10}
}

python find_lr.py --config_path="./config.json" --check_config
python train.py --config_path="./configs/my_config.json" --n_reruns=3
python eval.py --model_path="./models/custom_model" --data_file_path="./data/custom_test.txt" --device=-1