Skip to content

Model parameters

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓ ┃ Layer (type) ┃ Output Shape ┃ Param # ┃ Connected to ┃ ┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━┩ │ text_input (InputLayer) │ (None) │ 0 │ - │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ text_vectorization │ (None, 16) │ 0 │ text_input[0][0] │ │ (TextVectorization) │ │ │ │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ image_input (InputLayer) │ (None, 224, 224, 3) │ 0 │ - │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ embedding (Embedding) │ (None, 16, 128) │ 1,280,000 │ text_vectorization[0][0] │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ image_augmentation │ (None, 224, 224, 3) │ 0 │ image_input[0][0] │ │ (Sequential) │ │ │ │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ global_average_pooling1d │ (None, 128) │ 0 │ embedding[0][0] │ │ (GlobalAveragePooling1D) │ │ │ │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ xception (Functional) │ (None, 2048) │ 20,861,480 │ image_augmentation[0][0] │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ dense_text (Dense) │ (None, 256) │ 33,024 │ global_average_pooling1d[… │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ concatenate (Concatenate) │ (None, 2304) │ 0 │ xception[0][0], │ │ │ │ │ dense_text[0][0] │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ dense (Dense) │ (None, 512) │ 1,180,160 │ concatenate[0][0] │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ dropout (Dropout) │ (None, 512) │ 0 │ dense[0][0] │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ dense_1 (Dense) │ (None, 256) │ 131,328 │ dropout[0][0] │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ dropout_1 (Dropout) │ (None, 256) │ 0 │ dense_1[0][0] │ ├───────────────────────────────┼───────────────────────────┼─────────────────┼────────────────────────────┤ │ output (Dense) │ (None, 27) │ 6,939 │ dropout_1[0][0] │ └───────────────────────────────┴───────────────────────────┴─────────────────┴────────────────────────────┘ Total params: 23,492,931 (89.62 MB) Trainable params: 7,382,299 (28.16 MB) Non-trainable params: 16,110,632 (61.46 MB)

Class weights

Class 0: 1.0112 Class 1: 0.6619 Class 2: 1.8697 Class 3: 0.6458 Class 4: 1.1400 Class 5: 0.6303 Class 6: 1.2143 Class 7: 0.6197 Class 8: 1.5213 Class 9: 0.7312 Class 10: 0.6587 Class 11: 1.1784 Class 12: 0.3079 Class 13: 4.1158 Class 14: 0.6231 Class 15: 2.2117 Class 16: 0.7953 Class 17: 0.6298 Class 18: 1.2542 Class 19: 3.7759 Class 20: 0.9698 Class 21: 1.2618 Class 22: 3.8160 Class 23: 3.6079 Class 24: 1.2593 Class 25: 3.9170 Class 26: 3.8928

10 Epochs training and 1 epoch finetuning

Classification Report

          precision    recall  f1-score   support

       0     0.4000    0.4630    0.4292       622
       1     0.7131    0.6411    0.6752       950
       2     0.7131    0.7470    0.7297       336
       3     0.7464    0.4810    0.5850       973
       4     0.5730    0.7464    0.6483       552
       5     0.9300    0.8647    0.8962       998
       6     0.5284    0.7181    0.6088       518
       7     0.8060    0.7655    0.7852      1015
       8     0.3860    0.4552    0.4178       413
       9     0.8937    0.8698    0.8816       860
      10     0.7750    0.6426    0.7026       954
      11     0.6595    0.7472    0.7006       534
      12     0.9648    0.9119    0.9376      2042
      13     0.3983    0.6275    0.4873       153
      14     0.9049    0.9247    0.9147      1009
      15     0.7673    0.7430    0.7549       284
      16     0.9124    0.9090    0.9107       791
      17     0.8170    0.6533    0.7261       998
      18     0.6597    0.6267    0.6428       501
      19     0.7907    0.8193    0.8047       166
      20     0.6700    0.7145    0.6916       648
      21     0.6627    0.7892    0.7204       498
      22     0.5101    0.7636    0.6117       165
      23     0.9000    0.9828    0.9396       174
      24     0.6325    0.7174    0.6723       499
      25     0.6700    0.8323    0.7424       161
      26     0.7831    0.9193    0.8457       161

accuracy                         0.7484     16975

macro avg 0.7099 0.7436 0.7208 16975 weighted avg 0.7637 0.7484 0.7512 16975

True and predicted values

   count_true  count_pred

label 0 622 720 1 950 854 2 336 352 3 973 627 4 552 719 5 998 928 6 518 704 7 1015 964 8 413 487 9 860 837 10 954 791 11 534 605 12 2042 1930 13 153 241 14 1009 1031 15 284 275 16 791 788 17 998 798 18 501 476 19 166 172 20 648 691 21 498 593 22 165 247 23 174 190 24 499 566 25 161 200 26 161 189

confusion matrix