L'ATLAS SOCIOLOGIQUE MONDIAL


Accueil »  Classements et listes par thématique »  Langues »  Classement des langues du monde par nombre total de locuteurs (L1 + L2)

Classement des langues du monde par nombre total de locuteurs (L1 + L2)


par Atlasocio.com | Mis à jour le 29/01/2022

 

Les langues comptant le plus de locuteurs au monde sont l'anglais (de 1,85 milliard), le mandarin (1,12 milliard), l'hindoustani (775,25 millions), l'arabe (615,21 millions), et l'espagnol (591,97 millions). 13 autres langues regroupent plus de 100 millions de locuteurs : le malais, le français, le portugais, le bengali, le russe, l'allemand, le japonais, le swahili, le pendjabi, le farsi (persan), le pidgin nigérian, le vietnamien, et le marathi.

Le nombre total de locuteurs représente le nombre de locuteurs de langue première (L1) additionné au nombre de locuteurs de langue seconde (L2). Cependant, cet indicateur est délicat à appréhender statistiquement et il convient donc de prendre en considération plusieurs facteurs, dont les suivants :

  • – le nombre total de locuteurs est très souvent supérieur au nombre total de personnes recensées au sein d'une zone géographique donnée en raison des « doublons statistiques » résultants du multilinguisme (certaines personnes étant bilingues, trilingues voire plus) ;
  • – dans le cas d'une situation de bilinguisme parental, un enfant peut acquérir plusieurs langues natives (L1) simultanément lorsque les personnes chargées de son éducation emploient des langues différentes ;
  • – les citoyennes/citoyens d'un État ayant une seule langue officielle ne connaissent/parlent pas forcément cette même langue ;
  • – les citoyennes/citoyens des États ayant plusieurs langues officielles ne sont pas systématiquement multilingues ;
  • – en raison d'éventuelles tensions politiques, les données demeurent parfois partielles pour les minorités linguistiques ;
  • – définir précisément le nombre des locuteurs passifs est quasiment impossible et ce, tant en termes de langue(s) première(s) qu'en termes de langue(s) seconde(s).

Aussi, l'estimation du nombre total de locuteurs d'une langue demeure approximative et dépend également de nombreux autres paramètres statistiques (porosité sémantique des notions de langue seconde/langue étrangère, contextes historiques et sociolinguistiques, flux migratoires, âge, éducation, culture...). De plus, il n'est pas évident de distinguer linguistiquement une langue d’un « dialecte ». En effet, certaines langues – dont le chinois, l’arabe, et l'italien – sont considérées tantôt comme des langues uniques, tantôt comme des « familles de langues ». À cela s'ajoute le facteur politique qui complique plus encore toute évaluation du nombre de locuteurs : des États parlant une même langue désirent affirmer/marquer leur identité nationale en lui attribuant des noms différents (le serbe, le croate, le bosnien ou le monténégrin pour le serbo-croate, le moldave et le roumain pour la langue roumaine, l'indonésien et le malaisien pour le malais, etc.).


Publicité

Classements des langues du monde par nombre de locuteurs


Population faible                                            Population élevée

Note : Pour de plus amples informations concernant les statistiques relatives aux principales langues vivantes et/ou familles de langues du monde, veuillez consulter les classements d'Atlasocio.com en cliquant ici (données disponibles pour 5 416 langues vivantes référencées).

Classement des langues du monde par nombre total de locuteurs en 2020 [1]

Estimations Atlasocio.com selon les sources suivantes : recensements nationaux ; Summer Institute of Linguistics ; Encyclopedia of Language and Linguistics ; Nationalencyklopedin. [Sources détaillées]
Rang Langue Famille de langues Nombre total de locuteurs (L1 + L2)
© Atlasocio.com
Anglais [2] Langues germaniques 1 850 000 000
Mandarin Langues chinoises 1 120 200 000
Hindoustani (hindi, ourdou) [3] Langues indo-iraniennes 775 250 000
Arabe [4] Langues sémitiques 615 210 650
Espagnol Langues romanes 591 969 206
Malais [5] Langues malayo-polynésiennes 306 905 766
Français [6] Langues romanes 300 025 382
Portugais Langues romanes 270 945 470
Bengali (bangla) Langues indo-iraniennes 267 000 000
Russe Langues slaves 258 000 000
Allemand Langues germaniques 185 000 000
Japonais Langues japoniques 128 300 000
Swahili (kiswahili) Langues bantoues 123 800 000
Pendjabi (penjabi) [7] Langues indo-iraniennes 120 300 000
Farsi (persan) Langues indo-iraniennes 110 000 000
Pidgin nigérian (naija) Langues créoles (base lexicale anglaise) 107 500 000
Vietnamien Langues mon-khmer 102 797 878
Marathi (marathe) Langues indo-iraniennes 100 000 000
Télougou Langues dravidiennes 94 127 740
Haoussa Langues tchadiques 93 428 000
Turc Langues turciques 91 400 000
Philippin (filipino, tagalog) Langues malayo-polynésiennes 87 000 000
Yue (cantonais) Langues chinoises 85 538 610
Javanais Langues malayo-polynésiennes 84 608 470
Tamoul (tamil) Langues dravidiennes 83 000 000
Wu Langues chinoises 81 764 000
Coréen Isolats d'Asie 80 997 583
Italien [8] Langues romanes 78 600 000
Min [9] Langues chinoises 76 444 820
Thaï Langues taï-kadaï 73 000 000
Jin (jinyu) Langues chinoises 63 050 000
Gujarati Langues indo-iraniennes 60 000 000
Amharique Langues sémitiques 56 900 000
Kannada (kannara) Langues dravidiennes 56 606 512
Bhodjpouri (bhojpuri) Langues indo-iraniennes 52 460 000
Yoruba (yorouba) Langues voltaïco-nigériennes 52 000 000
Rajasthani Langues indo-iraniennes 50 000 000
Pachto (pachtoun) Langues indo-iraniennes 49 530 000
Hakka Langues chinoises 47 800 000
Birman Langues lolo-birmanes 42 900 000
Soundanais Langues malayo-polynésiennes 42 000 000
Igbo Langues voltaïco-nigériennes 42 000 000
Ukrainien Langues slaves 41 400 000
Polonais Langues slaves 40 850 000
Xiang Langues chinoises 38 300 000
Omoro Langues couchitiques 37 672 000
Odia (oriya) Langues indo-iraniennes 37 521 324
Sindhi (sindi) Langues indo-iraniennes 36 757 390
Somali Langues couchitiques 35 559 722
Malayalam Langues dravidiennes 35 538 819
Dari Langues indo-iraniennes 35 000 000
Maïthili Langues indo-iraniennes 34 700 000
Ouzbek Langues turciques 34 000 000
Azéri Langues turciques 33 100 000
Gan Langues chinoises 31 000 000
Kurde (dont kurmandji, sorani, gurani) Langues indo-iraniennes 30 510 000
Lao / Isan Langues taï-kadaï 30 000 000
Néerlandais Langues germaniques 30 000 000
Roumain Langues romanes 27 984 628
Zoulou (isiZulu) [10] Langues bantoues 27 779 100
Cebuano (cébouano, visayan) Langues malayo-polynésiennes 27 500 000
Saraiki (seraiki, siraiki) Langues indo-iraniennes 26 000 000
Malgache Langues malayo-polynésiennes 25 000 000
Assamais Langues indo-iraniennes 23 539 906
Peul (pulaar, fula) Langues atlantiques 22 500 000
Népalais (népali) Langues indo-iraniennes 22 010 000
Serbo-croate Langues slaves 21 174 000
Kazakh Langues turciques 21 000 000
Magahi Langues indo-iraniennes 20 700 000
Singhalais (cinghalais, cingalais) Langues indo-iraniennes 20 000 000
Xhosa (isiXhosa) Langues bantoues 19 200 000
Khmer (cambodgien) Langues mon-khmer 18 600 000
Chhattisgarhi Langues indo-iraniennes 18 000 000
Afrikaans Langues germaniques 17 500 000
Dioula (jula) Langues mandées 17 152 620
Wolof Langues atlantiques 16 000 000
Zhuang Langues taï-kadaï 16 000 000
Langues luhya Langues bantoues 15 000 000
Rangpuri Langues indo-iraniennes 15 000 000
Tiv Langues bantoïdes hors langues bantoues 15 000 000
Grec Langues helléniques (famille indo-européenne) 14 545 000
Bambara Langues mandées 14 500 000
Chittagonien Langues indo-iraniennes 14 500 000
Créole haïtien Langues créoles (base lexicale française) 14 481 260
Kinyarwanda (ikinyarwanda) Langues bantoues 14 258 000
Bavarois Langues germaniques 14 100 000
Sotho du Nord (sesotho sa leboa) Langues bantoues 13 731 000
Madurais Langues malayo-polynésiennes 13 694 000
Tswana Langues bantoues 13 664 710
Chewa (nyanja) Langues bantoues 13 661 000
Hongrois (magyar nyelv) Langues ouraliennes 13 552 400
Sotho du Sud (sesotho) Langues bantoues 13 500 000
Ouïghour Langues turciques 13 312 133
Suédois (svenska) Langues germaniques 13 175 800
Berar-deccan Langues indo-iraniennes 13 000 000
Bajjika Langues indo-iraniennes 12 793 416
Tchèque Langues slaves 12 500 000
Sadri (nagpuri) Langues indo-iraniennes 12 130 000
Kongo (kikongo) Langues bantoues 11 500 000
Kirundi (rundi) Langues bantoues 11 244 750
Akan Langues kwa 11 139 000
Hiligaïnon (hiligaynon) Langues malayo-polynésiennes 11 000 000
Bas allemand (Plattdüütsch) Langues germaniques 10 950 000
Shona (chishona, chona) Langues bantoues 10 905 000
Mazandarani (tabari, geleki) Langues indo-iraniennes 10 820 000
Sylheti Langues indo-iraniennes 10 300 000
Ilocano (ilokano) Langues malayo-polynésiennes 10 100 000
Catalan Langues romanes 10 048 969
Tigrigna Langues sémitiques 9 850 000
Haryanvi Langues indo-iraniennes 9 810 900
Bura-pabir Langues tchadiques 9 500 000
Kannauji [11] Langues indo-iraniennes 9 500 000
Umbundu (oumboundou) Langues bantoues 9 500 000
Quechua (dont kichwa/quichua) [12] Langues quechua 9 424 085
Hébreu Langues sémitiques 9 000 000
Luganda Langues bantoues 8 800 000
Makhuwa (makua) Langues bantoues 8 662 500
Soukouma (sukuma, kesukuma, kisukuma) Langues bantoues 8 100 000
Tadjik Langues indo-iraniennes 8 100 000
Marwari Langues indo-iraniennes 8 070 000
Khortha Langues indo-iraniennes 8 040 000
Bulgare Langues slaves 7 895 240
Turkmène Langues turciques 7 832 765
Moré (mooré) Langues gour 7 829 300
Albanais Langue albanaise (famille indo-européenne) 7 601 090
Santali Langues munda 7 600 000
Baoulé Langues kwa 7 468 290
Baloutchi Langues indo-iraniennes 7 407 640
Konkani Langues indo-iraniennes 7 400 000
Kituba (munukutuba, kikongo ya leta) Langues créoles (base lexicale kongo) 7 360 000
Biélorusse Langues slaves 7 247 100
Chleuh Langues berbères 7 200 000
Kikuyu (gikuyu) Langues bantoues 7 180 000
Alémanique Langues germaniques 7 162 000
Cachemiri (kashmiri) Langues indo-iraniennes 7 147 587
Luba-kasaï (tshiluba) Langues bantoues 7 060 000
Noakhailla Langues indo-iraniennes 7 000 000
Varhadi Langues indo-iraniennes 7 000 000
Guarani [13] Langues amérindiennes 6 500 000
Minangkabau Langues malayo-polynésiennes 6 500 000
Pinghua (ping) Langues chinoises 6 400 000
Vénitien Langues romanes 6 230 000
Arménien Langue arménienne (famille indo-européenne) 6 130 000
Danois Langues germaniques 6 000 000
Ibibio Langues cross river 6 000 000
Thaï du Nord Langues taï-kadaï 6 000 000
Banjar (bandjar) Langues malayo-polynésiennes 5 900 000
Finnois (suomi) Langues ouraliennes 5 842 500
Napolitain Langues romanes 5 700 000
Bundeli (bundelkhandi) Langues indo-iraniennes 5 600 000
Kabyle Langues berbères 5 599 200
Luo (dholuo) Langues nilo-sahariennes 5 550 000
Tatar Langues turciques 5 427 318
Malvi (malwi) Langues indo-iraniennes 5 400 000
Norvégien (dont nynorsk, landsmål) Langues germaniques 5 318 710
Slovaque Langues slaves 5 200 000
Pidgin ghanéen Langues créoles (base lexicale anglaise) 5 020 000
Betawi Langues créoles (base lexicale malaise) 5 000 000
Margi (marghi) Langues tchadiques 5 000 000
Touareg Langues berbères 5 000 000
Tsonga (xitsonga) Langues bantoues 4 877 500
Lambadi (labanki, gor-boli) Langues indo-iraniennes 4 857 819
Kirghize Langues turciques 4 827 977
Tamazight du Maroc central Langues berbères 4 750 000
Krio de Sierra Leone Langues créoles (base lexicale anglaise) 4 716 110
Kanuri (kanouri) Langues nilo-sahariennes 4 700 000
Sicilien Langues romanes 4 700 000
Éwé Langues voltaïco-nigériennes 4 685 760
Hindko Langues indo-iraniennes 4 650 000
Hui (huiyu) Langues chinoises 4 600 000
Romani Langues indo-iraniennes 4 554 600
Kamba (kikamba) Langues bantoues 4 500 000
Thaï du Sud (pak taï, dambro) Langues taï-kadaï 4 500 000
Kimbundu (mbundu) Langues bantoues 4 498 000
Potwari (pahari-pothwari) Langues indo-iraniennes 4 400 000
Rifain Langues berbères 4 400 000
Brahoui Langues dravidiennes 4 220 000
Mewari Langues indo-iraniennes 4 210 000
Tok pisin Langues créoles (base lexicale anglaise) 4 120 000
Bemba Langues bantoues 4 100 000
Bugi Langues malayo-polynésiennes 4 000 000
Singlish de Singapour Langues créoles (base lexicale anglaise) 4 000 000
Soso (soussou) Langues mandées 4 000 000
Dogri Langues indo-iraniennes 3 980 000
Balinais Langues malayo-polynésiennes 3 800 000
Géorgien Langues nord-caucasiennes 3 700 000
Lori (louri) Langues indo-iraniennes 3 675 000
Waray-waray (winaray) Langues malayo-polynésiennes 3 600 000
Maninkakan de l'Est Langues mandées 3 531 800
Aceh (achinais, acehnais) Langues malayo-polynésiennes 3 500 032
Lombard Langues romanes 3 500 000
Nkore Langues bantoues 3 400 000
Wagdi Langues indo-iraniennes 3 390 000
Khalkha Langues mongoles 3 380 000
Ndau Langues bantoues 3 358 000
Shan Langues taï-kadaï 3 300 000
Karen s'gaw Langues karens 3 250 000
Galicien Langues romanes 3 221 000
Bhili Langues indo-iraniennes 3 206 533
Créole jamaïcain Langues créoles (base lexicale anglaise) 3 200 000
Diola (jola, joola, djola) Langues atlantiques 3 200 000
Dagbani (dagbane, dagomba) Langues gour 3 160 000
Chiyao (yao) Langues bantoues 3 136 000
Palembang (musi) Langues malayo-polynésiennes 3 105 000
Soga (lusoga) Langues bantoues 3 100 000
Créole de Sabah Langues créoles (base lexicale malaise) 3 000 000
Ebira Langues voltaïco-nigériennes 3 000 000
Mewati Langues indo-iraniennes 3 000 000
Sidama Langues couchitiques 3 000 000
Songhaï (soŋay, sonrhaï...) Langues nilo-sahariennes 3 000 000
Toscan Langues romanes 3 000 000
Gondi Langues dravidiennes 2 980 000
Venda (tshivenda) Langues bantoues 2 829 000
Dialectes apuliens Langues romanes 2 800 000
Lituanien Langues baltes 2 722 289
Bouyei Langues taï-kadaï 2 700 000
Masaba (lumasaaba) Langues bantoues 2 700 000
Sasak (sassak) Langues malayo-polynésiennes 2 700 000
Bagheli (baghelkhandi) Langues indo-iraniennes 2 694 964
Tumbuka Langues bantoues 2 680 000
Sambalpuri Langues indo-iraniennes 2 630 000
Swati (siSwati) Langues bantoues 2 608 300
Lango (lwoo, leb-lango) Langues nilo-sahariennes 2 600 000
Bicolano central (bikol central) Langues malayo-polynésiennes 2 500 000
Hazara (hazaragi, zibun-i azoragi) Langues indo-iraniennes 2 500 000
Temné Langues atlantiques 2 500 000
Ndébélé du Transvaal (ndébélé du Sud) Langues bantoues 2 490 223
Gaélique irlandais Langues celtiques 2 438 338
Barese Langues romanes 2 400 000
Guilaki Langues indo-iraniennes 2 400 000
Lugbara Langues nilo-sahariennes 2 400 000
Maharashtri konkani Langues indo-iraniennes 2 400 000
Pampangue (Kapampangan) Langues malayo-polynésiennes 2 400 000
Sanskrit (sanscrit) Langues indo-iraniennes 2 360 821
Anaang (annang) Langues cross river 2 335 000
Surjapuri Langues indo-iraniennes 2 256 228
Od (oad, odki) Langues indo-iraniennes 2 250 000
Kurukh (oraon, kuṛux) Langues dravidiennes 2 228 000
Lomwe Langues bantoues 2 211 000
Gusii (ekegusii) Langues bantoues 2 205 000
Soninké Langues mandées 2 201 000
Fon (fon-gbe) Langues voltaïco-nigériennes 2 200 000
Kumaoni Langues indo-iraniennes 2 200 000
Slovène Langues slaves 2 200 000
Makondé (chimakondé, chinimakondé, kondé) Langues bantoues 2 151 000
Chaoui Langues berbères 2 130 000
Makassar Langues malayo-polynésiennes 2 130 000
Sena Langues bantoues 2 126 000
Acholi (acoli, akoli, atscholi, log acoli, dok acoli) Langues nilo-sahariennes 2 100 000
Macédonien Langues slaves 2 050 000
Gamo-gofa-dawro Langues omotiques 2 016 000
Sango Langues adamaoua-oubanguiennes 2 004 000
Arakanese (rakhine, marma) Langues lolo-birmanes 2 000 000
Batak toba Langues malayo-polynésiennes 2 000 000
Émilien Langues romanes 2 000 000
Malais de Makassar Langues créoles (base lexicale malaise) 2 000 000
Meru (kimeru) Langues bantoues 2 000 000
Nuosu Langues lolo-birmanes 2 000 000
Pidgin anglais camerounais Langues créoles (base lexicale anglaise) 2 000 000
Romanesco Langues romanes 2 000 000
Tchétchène Langues nord-caucasiennes 2 000 000
Urhobo Langues voltaïco-nigériennes 2 000 000
Aymara Langues amérindiennes 1 981 534
Afar Langues couchitiques 1 973 800
Tharu (tharuhat) Langues indo-iraniennes 1 930 000
Bicolano albay Langues malayo-polynésiennes 1 900 000
Kipsikis (kipsigis, lumbwa) Langues nilo-sahariennes 1 900 000
Mijikenda Langues bantoues 1 900 000
Bagri Langues indo-iraniennes 1 890 815
Khandeshi Langues indo-iraniennes 1 860 000
Teso (ateso) Langues nilo-sahariennes 1 849 000
Toulou (tulu) Langues dravidiennes 1 841 963
Agni (anyin) Langues kwa 1 826 400
Calabrais Langues romanes 1 800 000
Hani Langues lolo-birmanes 1 800 000
Karekare (karai-karai) Langues tchadiques 1 800 000
Memoni Langues indo-iraniennes 1 800 000
Rohingya (ruáingga) Langues indo-iraniennes 1 800 000
Tibétain de l'Amdo Langues tibéto-himalayennes 1 800 000
Meitei Langues naga 1 760 000
Letton (lette) Langues baltes 1 752 260
Tchokwé (chokwe) Langues bantoues 1 744 200
Surgujia Langues indo-iraniennes 1 738 256
Malinké de l'Ouest Langues mandées 1 733 000
Kabarde Langues nord-caucasiennes 1 712 000
Occitan Langues romanes 1 708 045
Alur Langues nilo-sahariennes 1 700 000
Kangri Langues indo-iraniennes 1 700 000
Mundari Langues munda 1 661 656
Bulu (boulou) Langues bantoues 1 658 000
Nahuatl (náhuatl huasteco) Langues uto-aztèques 1 651 958
Malais d'Alor Langues créoles (base lexicale malaise) 1 650 000
Malais d'Ambon Langues créoles (base lexicale malaise) 1 645 000
Zazaki Langues indo-iraniennes 1 640 000
Ndébélé du Zimbabwe (ndébélé du Nord) Langues bantoues 1 634 800
Tày Langues taï-kadaï 1 630 000
Wolaitta Langues omotiques 1 630 000
Créole libérien Langues créoles (base lexicale anglaise) 1 613 000
Braj bhasha Langues indo-iraniennes 1 600 000
Créole de Guinée-Bissau Langues créoles (base lexicale portugaise) 1 600 000
Édo (bini) Langues voltaïco-nigériennes 1 600 000
Kiga Langues bantoues 1 600 000
Dan (gio, yacouba) Langues mandées 1 577 000
Pangasinan Langues malayo-polynésiennes 1 560 000
Scots Langues germaniques 1 541 693
Luba-katanga (luba-shaba) Langues bantoues 1 505 000
Maa (massaï, maasai, masaï) Langues nilo-sahariennes 1 500 000
Pa'o Langues karens 1 500 000
Rombo (kirombo) Langues bantoues 1 500 000
Salentin Langues romanes 1 500 000
Tonga (chitonga, zambezi) Langues bantoues 1 500 000
Mendé Langues mandées 1 499 700
Iban (dayak de la mer) Langues malayo-polynésiennes 1 484 400
Lampung pesisir (lampung api) Langues malayo-polynésiennes 1 477 000
Dhundari Langues indo-iraniennes 1 476 446
Nyamwezi Langues bantoues 1 470 000
Oshiwambo (ovambo) Langues bantoues 1 441 000
Ho Langues munda 1 421 418
Kokborok Langues sal 1 411 294
Sérère Langues atlantiques 1 410 700
Boro (bodo) Langues sal 1 400 000
Bukusu Langues bantoues 1 400 000
Gogo Langues bantoues 1 400 000
Miao chuanqiandian (dont miao de Shuijingping, miao de Xinzhai...) Langues hmong-mien 1 400 000
Tibétain de Kham Langues tibéto-himalayennes 1 400 000
Chuwabu (chichwabo, chuabo, chuwabo) Langues bantoues 1 396 000
Abron (brong, bron, doma, gyaman) Langues kwa 1 393 000
Bachkir Langues turciques 1 379 700
Tamang Langues tibéto-himalayennes 1 370 154
Q'eqchi' (kekchi, kektxí) Langues mayas 1 370 007
Tétoum (tétum, tetum, tetun) Langues malayo-polynésiennes 1 362 712
Nyakyusa Langues bantoues 1 359 000
Dinka Langues nilo-sahariennes 1 352 120
Comorien (shikomori, shimasiwa) Langues bantoues 1 350 729
Piémontais Langues romanes 1 350 000
Sarde Langues romanes 1 350 000
Mandinka Langues mandées 1 346 000
Créole mauricien Langues créoles (base lexicale française) 1 335 000
Manyika Langues bantoues 1 334 000
Yaka Langues bantoues 1 331 000
Hadiyya Langues couchitiques 1 300 000
Haya (kihaya) Langues bantoues 1 300 000
Kam (dong du Sud) Langues taï-kadaï 1 300 000
Kpèllé (kpelle) Langues mandées 1 300 000
Limbourgeois Langues germaniques 1 300 000
Tchouvache Langues turciques 1 279 650
Bai Langues tibéto-birmanes 1 272 000
Hmu septentrional Langues hmong-mien 1 250 000
Zandé Langues adamaoua-oubanguiennes 1 242 000
Batak dairi Langues malayo-polynésiennes 1 200 000
Batak simalungun Langues malayo-polynésiennes 1 200 000
Chavacano Langues créoles (base lexicale espagnole) 1 200 000
Flamand occidental (westflamand) Langues germaniques 1 200 000
Ikwere (ikwerre) Langues voltaïco-nigériennes 1 200 000
Kabiyè Langues gour 1 200 000
Nyaneka (haneca) Langues bantoues 1 200 000
Tibétain central (dbus, ü-tsang) Langues tibéto-himalayennes 1 200 000
Vasavi Langues indo-iraniennes 1 200 000
Bedja Langues couchitiques 1 186 000
Basque Isolats d'Europe 1 185 500
Tswa (xitswa) Langues bantoues 1 180 000
Garo Langues sal 1 145 323
Muong Langues mon-khmer 1 140 000
Nsenga (senga) Langues bantoues 1 133 000
Estonien Langues ouraliennes 1 132 500
Parauk Langues mon-khmer 1 118 000
Batak mandailing Langues malayo-polynésiennes 1 100 000
Bhilali Langues indo-iraniennes 1 100 000
Flamand oriental Langues germaniques 1 100 000
Khortchin Langues mongoles 1 100 000
Maguindanao (maguindanaon) Langues malayo-polynésiennes 1 100 000
Quiché (k'iche') Langues mayas 1 100 000
Romagnol Langues romanes 1 100 000
Dagaare (dagara) Langues gour 1 088 000
Ndonga (oshindonga) Langues bantoues 1 070 000
Ronga Langues bantoues 1 064 200
Tausug Langues malayo-polynésiennes 1 062 000
K'iche' (quiché) Langues amérindiennes 1 050 000
Pwo de l'Est Langues karens 1 050 000
Tigré Langues sémitiques 1 050 000
Khasi Langues mon-khmer 1 037 964
Kissi Langues atlantiques 1 035 000
Kutchi (katchi) Langues indo-iraniennes 1 031 000
Fang (pamue) Langues bantoues 1 027 900
Adangme (dangme, adangbe) Langues kwa 1 020 000
Gallois Langues celtiques 1 015 600
Turkana Langues nilo-sahariennes 1 013 000
Achomi (larestani) Langues indo-iraniennes 1 000 000
Bakhtiari Langues indo-iraniennes 1 000 000
Berom (birom) Langues platoïdes 1 000 000
Créole hawaïen Langues créoles (base lexicale anglaise) 1 000 000
Créole trinidadien Langues créoles (base lexicale anglaise) 1 000 000
Gorontalo (hulontalo) Langues malayo-polynésiennes 1 000 000
Gujari (Gujri, gojari, gojri) Langues indo-iraniennes 1 000 000
Igala (igara) Langues voltaïco-nigériennes 1 000 000
Izon Langues ijo 1 000 000
Kisongye (kisonge, songe) Langues bantoues 1 000 000
Mahasu pahari Langues indo-iraniennes 1 000 000
Maranao Langues malayo-polynésiennes 1 000 000
Nasu Langues lolo-birmanes 1 000 000
Nupe (anufe, nupenci, nyinfe, tapa) Langues voltaïco-nigériennes 1 000 000
Palatin Langues germaniques 1 000 000
Shaozhou tuhua Langues chinoises 1 000 000
Sources détaillées : recensements nationaux officiels ; Ethnologue: Languages of the World, Summer Institute of Linguistics ; Encyclopedia of Language and Linguistics, Ronald E. Asher (editor, 1994), Keith Brown (editor, 2006), Elsevier, 1994, 2006 (2nd edition) ; Nationalencyklopedin: Ett uppslagsverk på vetenskaplig grund utarbetat på initiativ av Statens kulturråd, NE Nationalencyklopedin AB, 2020.
Note(s) :
[1] Année indiquée ou dernière année pour laquelle des données sont disponibles.
[2] La langue anglaise serait comprise par environ 2 milliards de personnes. Cf. David Crystal, “Two Thousand Million?”, Cambridge University Press, English Today 24, n°1, 2008.
[3] L'hindi standard moderne et l’ourdou standard moderne sont mutuellement intelligibles et considérés par les linguistes comme des dialectes de la même langue. La distinction « officielle » est le résultat des tendances nationalistes respectives de l'Inde et du Pakistan. En 2020, l'hindi compte 295,25 millions de locuteurs natifs et 251,25 millions de locuteurs de langue seconde, soit un total de 546,5 millions de locuteurs ; tandis que l'ourdou regroupe 75,665 millions de locuteurs natifs et 153,095 millions de locuteurs de langue seconde, soit un total de 228,75 millions de locuteurs.
[4] Linguistiquement, la langue arabe est divisée en plusieurs dialectes, parfois très éloignés et qui ne permettent pas toujours une intelligibilité mutuelle. De plus, il existe une importante diglossie entre l'arabe littéral (langue véhiculaire principalement écrite) et les nombreux arabes dialectaux (langues vernaculaires principalement orales). Pour autant, la langue arabe est généralement considérée comme une langue unique en raison des facteurs géopolitiques, sociohistoriques et religieux.
[5] Le malais péninsulaire (langue officielle de la Malaisie et du Brunei) et l'indonésien (langue officielle de l'Indonésie), bien que considérés par certains linguistes comme étant des langues distinctes, présentent 80 % de vocabulaire commun. Aussi, les quelques divergences n'empêchent pas l'intercompréhension entre Malaisiens et Indonésiens. À noter que l'indonésien standard incorpore de nombreux apports de l'anglais, du néerlandais, du portugais, et des langues régionales indonésiennes, notamment du javanais.
[6] Estimation Atlasocio.com du nombre de francophones pour l'année 2020 selon la projection pour l’année correspondante (variante moyenne) de l'ONU (World Population Prospects: The 2019 Revision, Population Division, Department of Economic and Social Affairs, United Nations), croisée aux donnnées issues de l'ouvrage de Baptiste Beck, Richard Marcoux, Laurent Richard et Alexandre Wolff intitulé Estimation des populations francophones dans le monde en 2018 in Sources et démarches méthodologiques, Québec, Observatoire démographique et statistique de l’espace francophone, Université Laval, Rapport de recherche de l’ODSEF, 2018. À noter que l'État francophone le plus peuplé du monde est la République démocratique du Congo mais, étant donné que le français n'est pas parlé par l'ensemble de la population, la France demeure le pays comptant le plus grand nombre de francophones natifs.
[7] Le nombre de locuteurs du pendjabi diffère en raison des méthodes de comptage employées, allant de 113 à 125 millions de locuteurs natifs selon les sources. En effet, les linguistes ne parviennent pas à un consensus clair concernant les principaux dialectes du pendjabi (lahnda, majhi, doabi, malwai, powadhi, pothohari, multani…). Ainsi, le Summer Institute of Linguistics distingue le « pendjabi occidental » (dont les langues lahnda) parlé au Pakistan (65 millions de locuteurs natifs en 2021) du « pendjabi oriental » parlé en Inde (52 millions de locuteurs natifs en 2021). D'autres études suggèrent que le pendjabi occidental est au contraire une langue distincte des dialectes « lahnda » (Cf. George Abraham Grierson, Linguistic Survey of India, compiled and edited by George Abraham Grierson, Office of the Superintendent of Government Printing, Calcutta, India, 1903-1928). En outre, depuis le recensement national du Pakistan de 1981, le saraiki/seraiki (anciennement « lahnda du sud ») et l'hindko (auparavant rattachés au pendjabi occidental) ont le statut de langues distinctes du pendjabi. À l’échelle mondiale, les locuteurs natifs du pendjabi se répartissent comme suit : 80 540 000 au Pakistan (recensement de 2017), 33 124 726 en Inde (recensement de 2011), 501 680 au Canada (recensement de 2016), 280 000 aux États-Unis (cf. "US survey puts Punjabi speakers in US at 2.8 lakh", Times of India, 18 December 2017), 270 000 au Royaume-Uni (recensement de 2011), ainsi qu’un petit nombre de locuteurs dans d’autres pays. Enfin, le vocabulaire du « pendjabi moderne » est influencé par d'autres langues, notamment l'hindoustani, le persan, le sanskrit ou bien encore l'anglais.
[8] La langue italienne comprend l’italien « standard » issu du toscan de Florence, Pise et Sienne dont la grammaire est clairement définie et encadrée par un organisme de référence (Accademia della Crusca) ; des variantes régionales aux prononciations et aux accents différents mais dont les bases linguistiques proviennent toutes de l’italien standard et sont donc mutuellement intelligibles avec celui-ci ; ainsi que des dialectes qui sont quant à eux des langues différentes et mutuellement inintelligibles. Aussi, si l’italien demeure la langue maternelle majoritaire en Italie, l’utilisation de l'italien standard alterne dans certaines zones géographiques et dans différents segments de la population avec l'utilisation d'un dialecte ou d'une variante régionale. Ces éléments doivent être pris en considération afin d’expliquer notamment les « doublons » statistiques, inévitables pour le cas de la langue italienne et de ses dialectes. Ainsi, selon les sources, il existe des estimations très contradictoires sur le nombre d’italophones, tant pour définir le nombre total de locuteurs que pour tenter de déterminer le nombre de locuteur en tant que langue maternelle ou langue seconde.
[9] La langue min se compose de cinq variétés principales : le minnan (50 184 500 locuteurs natifs en 2019, dont 387 000 locuteurs de langue seconde), le minbei (10 304 000 locuteurs natifs en 1984), le mindong (10 297 520 locuteurs natifs en 2017), le minzhong (3 100 000 locuteurs natifs en 2000) et le puxian (2 558 800 locuteurs natifs en 2000). À noter toutefois que les différentes variétés de la langue min ne sont pas mutuellement intelligibles entre elles ainsi qu'avec les autres langues chinoises, d'où parfois des données distinctes pour chacune d'entre elles selon les sources.
[10] « Le zoulou (IsiZulu) est la langue du plus grand groupe ethnique de l'Afrique du Sud (22,7 %). C'est donc la langue sud-africaine la plus largement comprise » (Cf. J. Leclerc, « Afrique du Sud – (1) Généralités » in L'aménagement linguistique dans le monde, CEFAN, Université Laval, dernière mise à jour le 18 avril 2018).
[11] Le kannauji est une langue indo-aryenne parlée dans la région de Kannauj, au sein l'État de l'Uttar Pradesh en Inde. Le kannauji est étroitement apparenté à l'hindoustani, avec une similitude lexicale de 83 à 94 %. Certains linguistes le considèrent comme un dialecte de l'hindoustani, alors que d'autres le considèrent comme une langue distincte de l'hindi occidental.
[12] Il convient de ne pas confondre le q'eqchi' avec le k'iche' (quiché) qui sont deux langues mayas distinctes, ni de les associer avec le kichwa (quichua) rattaché au quechua. Concernant le nombre de locuteurs du quechua par État, plusieurs données sont disponibles :
– Pérou (recensement de 2017) : 3 799 780 locuteurs natifs (13,6 % de la population), bien que 5 176 809 personnes s'identifient comme ethniquement quechua (22,32 %) ;
– Bolivie (recensement de 2012) : 1 837 105 personnes se définissaient comme Quechuas, dont 1 613 210 parlaient la langue, soit 18 % de la population ;
– Argentine (selon l'Unesco en 2019) : 1 490 000 locuteurs natifs (dont 90 000 locuteurs natifs d'Argentine et environ 1 400 000 locuteurs natifs originaires de Bolivie et du Pérou) ;
– Équateur : 591 448 locuteurs natifs selon le recensement de 2010 et 724 721 locuteurs natifs selon une étude de 2020 (cf. Fernando Garcés Velásquez, Las comunidades virtuales del quichua ecuatoriano: revalorizando la lengua en un espacio apropiado [The Virtual Communities of the Ecuadorian Quichua: Revaluing the Language in an appropriated Space], Punto Cero v.25 n.40 Cochabamba sep. 2020) ;
– Chili (estimation de 2012) : 180 000 locuteurs dont la population migrante (les dernières données officielles sont de 6 175 locuteurs natifs selon le recensement de 2002 et de 33 868 personnes qui se sont identifiées comme Quechuas selon le recensement de 2017) ;
– Colombie : 15 450 locuteurs natifs en 2005 selon l'Organización Nacional Indígena de Colombia.
[13] « Lorsque l'on additionne les monolingues en guarani et les bilingues qui parlent cette langue, le chiffre atteint 87 % des locuteurs [du Paraguay]. » (Cf. « El 87 % de la población paraguaya habla guaraní », E'a Digital, Asunción, Paraguay, 6 Enero 2011 - Source : Censo Poblacional del Paraguay, Dirección General de Encuesta, Estadística y Censo, 2002).