L'ATLAS SOCIOLOGIQUE MONDIAL


Accueil »  Classements et listes par thématique »  Langues »  Classement des langues du monde par nombre de locuteurs natifs (L1)

Classement des langues du monde par nombre de locuteurs natifs (L1)


par Atlasocio.com | Mis à jour le 31/01/2022

 

Les langues maternelles (ou langues natives) comptant le plus de locuteurs au monde sont le mandarin (921,5 millions de personnes), l'espagnol (493 millions), l'anglais (400 millions), l'hindoustani (370,9 millions), et l'arabe (345,2 millions). Cinq autres langues regroupent plus de 100 millions de locuteurs natifs : le portugais (245,7 millions), le bengali (230 millions), le russe (153,7 millions), le japonais (127,2 millions) et le pendjabi (114,8 millions).

Parmi les 5 416 langues vivantes principales référencées par Atlasocio.com, 4 248 langues comptent moins de 100 000 locuteurs natifs – soit 78,43 % du total – et peuvent donc être considérées comme en grand danger d'extinction. Les 10 langues comptant plus de 100 millions de locuteurs natifs représentent 3 402 020 119 personnes soit 43,64 % de la population mondiale en 2020. Toujours à l'échelle globale, les 100 langues natives (ou maternelles) les plus parlées regroupent 6 439 909 183 locuteurs, soit 82,62 % de la population mondiale alors qu'elles ne représentent que 1,84 % des 5 416 langues vivantes principales répertoriées au sein de notre base de données. Ainsi, 17,38 % de l'humanité se partagent les 98,16 % des langues restantes.

Définition de langue native (langue première, langue natale ou langue maternelle) :
« Une langue native – également appelée langue maternelle, langue natale ou langue première – désigne la première langue acquise/apprise chronologiquement par un individu durant l'enfance, généralement avant 12 ans. Toutefois, dans le cas d'une situation de bilinguisme parental, un enfant peut acquérir plusieurs langues natives simultanément lorsque les personnes chargées de son éducation emploient des langues différentes. Enfin, il convient de distinguer sémantiquement les termes “langue maternelle” qui se réfère à la langue parlée par la mère et “langue paternelle” qui se réfère à la langue parlée par le père. » [définition : Atlasocio.com]

La langue native, à la différence de la langue seconde, est une langue apprise dès le plus jeune âge, généralement dans le cadre familial, soit une langue parlée/comprise par l'enfant avant qu'il ne débute son parcours scolaire. Cependant, en termes d'analyse, les données relatives au nombre de locuteurs natifs doivent être appréhendées avec précaution en raison des différentes méthodes d'évaluation employées. En effet, les méthodologies statistiques diffèrent selon les recensements nationaux ou études disponibles afin de définir la langue native/maternelle, privilégiant tantôt la première langue apprise, tantôt la langue d'utilisation primaire. De plus, les notions de langue seconde/langue étrangère varient en fonction des contextes politiques, géographiques, historiques et sociolinguistiques.


Publicité

Classements des langues du monde par nombre de locuteurs


Population faible                                            Population élevée

Note : Pour de plus amples informations concernant les statistiques relatives aux principales langues vivantes et/ou familles de langues du monde, veuillez consulter les classements d'Atlasocio.com en cliquant ici (données disponibles pour 5 416 langues vivantes référencées).

Classement des langues du monde par nombre de locuteurs natifs en 2020 [1]

Estimations Atlasocio.com selon les sources suivantes : recensements nationaux ; Summer Institute of Linguistics ; Encyclopedia of Language and Linguistics ; Nationalencyklopedin. [Sources détaillées]
Rang Langue Famille de langues Nombre de locuteurs natifs (L1)
© Atlasocio.com
Mandarin Langues chinoises 921 500 000
Espagnol Langues romanes 493 000 000
Anglais [2] Langues germaniques 400 000 000
Hindoustani (hindi, ourdou) [3] Langues indo-iraniennes 370 905 000
Arabe [4] Langues sémitiques 345 210 650
Portugais Langues romanes 245 745 470
Bengali (bangla) Langues indo-iraniennes 230 000 000
Russe Langues slaves 153 700 000
Japonais Langues japoniques 127 158 999
Pendjabi (penjabi) [5] Langues indo-iraniennes 114 800 000
Allemand Langues germaniques 97 500 000
Français [6] Langues romanes 90 766 000
Vietnamien Langues mon-khmer 87 387 710
Yue (cantonais) Langues chinoises 85 136 610
Javanais Langues malayo-polynésiennes 84 608 470
Marathi (marathe) Langues indo-iraniennes 83 100 000
Turc Langues turciques 82 500 000
Wu Langues chinoises 81 700 000
Télougou Langues dravidiennes 81 127 740
Coréen Isolats d'Asie 80 997 583
Malais [7] Langues malayo-polynésiennes 77 885 621
Min [8] Langues chinoises 76 057 820
Tamoul (tamil) Langues dravidiennes 75 000 000
Farsi (persan) Langues indo-iraniennes 70 000 000
Italien [9] Langues romanes 64 800 000
Haoussa Langues tchadiques 63 428 000
Jin (jinyu) Langues chinoises 63 050 000
Gujarati Langues indo-iraniennes 56 000 000
Bhodjpouri (bhojpuri) Langues indo-iraniennes 52 300 000
Yoruba (yorouba) Langues voltaïco-nigériennes 50 000 000
Rajasthani Langues indo-iraniennes 50 000 000
Pachto (pachtoun) Langues indo-iraniennes 49 530 000
Pidgin nigérian (naija) Langues créoles (base lexicale anglaise) 47 500 000
Kannada (kannara) Langues dravidiennes 43 706 512
Hakka Langues chinoises 43 600 000
Soundanais Langues malayo-polynésiennes 42 000 000
Ukrainien Langues slaves 41 400 000
Polonais Langues slaves 39 700 000
Xiang Langues chinoises 38 300 000
Omoro Langues couchitiques 37 672 000
Sindhi (sindi) Langues indo-iraniennes 36 757 390
Malayalam Langues dravidiennes 34 838 819
Odia (oriya) Langues indo-iraniennes 34 712 170
Maïthili Langues indo-iraniennes 34 712 170
Birman Langues lolo-birmanes 32 900 000
Amharique Langues sémitiques 31 800 000
Gan Langues chinoises 31 000 000
Lao / Isan Langues taï-kadaï 30 000 000
Ouzbek Langues turciques 29 550 000
Thaï Langues taï-kadaï 29 000 000
Igbo Langues voltaïco-nigériennes 27 000 000
Kurde (dont kurmandji, sorani, gurani) Langues indo-iraniennes 26 350 000
Saraiki (seraiki, siraiki) Langues indo-iraniennes 26 000 000
Azéri Langues turciques 25 100 000
Malgache Langues malayo-polynésiennes 25 000 000
Néerlandais Langues germaniques 25 000 000
Philippin (filipino, tagalog) Langues malayo-polynésiennes 24 000 000
Roumain Langues romanes 23 984 628
Peul (pulaar, fula) Langues atlantiques 22 500 000
Somali Langues couchitiques 21 807 730
Serbo-croate Langues slaves 21 174 000
Magahi Langues indo-iraniennes 20 700 000
Dari Langues indo-iraniennes 20 500 000
Chhattisgarhi Langues indo-iraniennes 18 000 000
Singhalais (cinghalais, cingalais) Langues indo-iraniennes 17 000 000
Khmer (cambodgien) Langues mon-khmer 16 600 000
Swahili (kiswahili) Langues bantoues 16 300 000
Cebuano (cébouano, visayan) Langues malayo-polynésiennes 16 100 000
Zhuang Langues taï-kadaï 16 000 000
Assamais Langues indo-iraniennes 15 311 351
Rangpuri Langues indo-iraniennes 15 000 000
Tiv Langues bantoïdes hors langues bantoues 15 000 000
Langues luhya Langues bantoues 15 000 000
Grec Langues helléniques (famille indo-européenne) 14 545 000
Chittagonien Langues indo-iraniennes 14 500 000
Créole haïtien Langues créoles (base lexicale française) 14 481 260
Kinyarwanda (ikinyarwanda) Langues bantoues 14 258 000
Bavarois Langues germaniques 14 100 000
Ouïghour Langues turciques 13 312 133
Berar-deccan Langues indo-iraniennes 13 000 000
Kazakh Langues turciques 12 900 000
Népalais (népali) Langues indo-iraniennes 12 794 723
Bajjika Langues indo-iraniennes 12 793 416
Hongrois (magyar nyelv) Langues ouraliennes 12 552 400
Zoulou (isiZulu) [10] Langues bantoues 12 079 100
Kirundi (rundi) Langues bantoues 11 244 750
Akan Langues kwa 11 139 000
Shona (chishona, chona) Langues bantoues 10 905 000
Tchèque Langues slaves 10 702 000
Chewa (nyanja) Langues bantoues 10 661 000
Suédois (svenska) Langues germaniques 9 920 228
Tigrigna Langues sémitiques 9 850 000
Haryanvi Langues indo-iraniennes 9 810 900
Bura-pabir Langues tchadiques 9 500 000
Kannauji [11] Langues indo-iraniennes 9 500 000
Umbundu (oumboundou) Langues bantoues 9 500 000
Sylheti Langues indo-iraniennes 8 800 000
Xhosa (isiXhosa) Langues bantoues 8 200 000
Ilocano (ilokano) Langues malayo-polynésiennes 8 100 000
Tadjik Langues indo-iraniennes 8 100 000
Soukouma (sukuma, kesukuma, kisukuma) Langues bantoues 8 100 000
Khortha Langues indo-iraniennes 8 040 000
Bulgare Langues slaves 7 895 240
Turkmène Langues turciques 7 832 765
Moré (mooré) Langues gour 7 829 300
Quechua (dont kichwa/quichua) [12] Langues quechua 7 823 161
Marwari Langues indo-iraniennes 7 800 000
Albanais (dont gheg, tosk, arbereshe, arvanitika) Langue albanaise (famille indo-européenne) 7 601 090
Santali Langues munda 7 600 000
Baoulé Langues kwa 7 468 290
Makhuwa (makua) Langues bantoues 7 430 000
Baloutchi Langues indo-iraniennes 7 407 640
Konkani Langues indo-iraniennes 7 400 000
Afrikaans Langues germaniques 7 200 000
Chleuh Langues berbères 7 200 000
Kikuyu (gikuyu) Langues bantoues 7 180 000
Alémanique Langues germaniques 7 162 000
Cachemiri (kashmiri) Langues indo-iraniennes 7 147 587
Luba-kasaï (tshiluba) Langues bantoues 7 060 000
Hiligaïnon (hiligaynon) Langues malayo-polynésiennes 7 000 000
Noakhailla Langues indo-iraniennes 7 000 000
Varhadi Langues indo-iraniennes 7 000 000
Dioula (jula) Langues mandées 6 852 620
Madurais Langues malayo-polynésiennes 6 700 000
Kongo (kikongo) Langues bantoues 6 500 000
Pinghua (ping) Langues chinoises 6 400 000
Vénitien Langues romanes 6 230 000
Thaï du Nord Langues taï-kadaï 6 000 000
Banjar (bandjar) Langues malayo-polynésiennes 5 900 000
Finnois (suomi) Langues ouraliennes 5 842 500
Danois Langues germaniques 5 700 000
Guarani [13] Langues tupi 5 700 000
Napolitain Langues romanes 5 700 000
Sotho du Sud (sesotho) Langues bantoues 5 600 000
Luganda Langues bantoues 5 600 000
Bundeli (bundelkhandi) Langues indo-iraniennes 5 600 000
Kabyle Langues berbères 5 599 200
Luo (dholuo) Langues nilo-sahariennes 5 550 000
Minangkabau Langues malayo-polynésiennes 5 530 000
Biélorusse Langues slaves 5 469 400
Wolof Langues atlantiques 5 454 000
Malvi (malwi) Langues indo-iraniennes 5 400 000
Kituba (munukutuba, kikongo ya leta) Langues créoles (base lexicale kongo) 5 360 000
Norvégien (dont nynorsk, landsmål) Langues germaniques 5 318 710
Tatar Langues turciques 5 227 318
Tswana Langues bantoues 5 181 700
Sadri (nagpuri) Langues indo-iraniennes 5 130 000
Margi (marghi) Langues tchadiques 5 000 000
Hébreu Langues sémitiques 5 000 000
Pidgin ghanéen Langues créoles (base lexicale anglaise) 5 000 000
Touareg Langues berbères 5 000 000
Betawi Langues créoles (base lexicale malaise) 5 000 000
Slovaque Langues slaves 4 940 000
Tsonga (xitsonga) Langues bantoues 4 877 500
Lambadi (labanki, gor-boli) Langues indo-iraniennes 4 857 819
Kirghize Langues turciques 4 827 977
Tamazight du Maroc central Langues berbères 4 750 000
Kanuri (kanouri) Langues nilo-sahariennes 4 700 000
Sicilien Langues romanes 4 700 000
Sotho du Nord (sesotho sa leboa) Langues bantoues 4 700 000
Éwé Langues voltaïco-nigériennes 4 685 760
Hindko Langues indo-iraniennes 4 650 000
Hui (huiyu) Langues chinoises 4 600 000
Romani Langues indo-iraniennes 4 554 600
Thaï du Sud (pak taï, dambro) Langues taï-kadaï 4 500 000
Kimbundu (mbundu) Langues bantoues 4 498 000
Arménien Langue arménienne (famille indo-européenne) 4 430 000
Potwari (pahari-pothwari) Langues indo-iraniennes 4 400 000
Rifain Langues berbères 4 400 000
Brahoui Langues dravidiennes 4 220 000
Mewari Langues indo-iraniennes 4 210 000
Bambara Langues mandées 4 102 320
Bemba Langues bantoues 4 100 000
Catalan Langues romanes 4 079 420
Singlish (Singapour) Langues créoles (base lexicale anglaise) 4 000 000
Dogri Langues indo-iraniennes 3 980 000
Balinais Langues malayo-polynésiennes 3 900 000
Kamba (kikamba) Langues bantoues 3 900 000
Géorgien Langues nord-caucasiennes 3 700 000
Lori (louri) Langues indo-iraniennes 3 675 000
Waray-waray (winaray) Langues malayo-polynésiennes 3 600 000
Maninkakan de l'Est Langues mandées 3 531 800
Aceh (achinais, acehnais) Langues malayo-polynésiennes 3 500 032
Bugi Langues malayo-polynésiennes 3 500 000
Lombard Langues romanes 3 500 000
Nkore Langues bantoues 3 400 000
Wagdi Langues indo-iraniennes 3 390 000
Ndau Langues bantoues 3 358 000
Shan Langues taï-kadaï 3 300 000
Karen s'gaw Langues karens 3 250 000
Galicien Langues romanes 3 221 000
Bhili Langues indo-iraniennes 3 206 533
Créole jamaïcain Langues créoles (base lexicale anglaise) 3 200 000
Diola (jola, joola, djola) Langues atlantiques 3 200 000
Dagbani (dagbane, dagomba) Langues gour 3 160 000
Chiyao (yao) Langues bantoues 3 136 000
Palembang (musi) Langues malayo-polynésiennes 3 105 000
Soga (lusoga) Langues bantoues 3 100 000
Créole de Sabah Langues créoles (base lexicale malaise) 3 000 000
Ebira Langues voltaïco-nigériennes 3 000 000
Mewati Langues indo-iraniennes 3 000 000
Sidama Langues couchitiques 3 000 000
Songhaï (soŋay, sonrhaï...) Langues nilo-sahariennes 3 000 000
Toscan Langues romanes 3 000 000
Gondi Langues dravidiennes 2 980 000
Dialectes apuliens Langues romanes 2 800 000
Lituanien Langues baltes 2 722 289
Bouyei Langues taï-kadaï 2 700 000
Masaba (lumasaaba) Langues bantoues 2 700 000
Sasak (sassak) Langues malayo-polynésiennes 2 700 000
Bagheli (baghelkhandi) Langues indo-iraniennes 2 694 964
Tumbuka Langues bantoues 2 680 000
Sambalpuri Langues indo-iraniennes 2 630 000
Lango (lwoo, leb-lango) Langues nilo-sahariennes 2 600 000
Bicolano central (bikol central) Langues malayo-polynésiennes 2 500 000
Hazara (hazaragi, zibun-i azoragi) Langues indo-iraniennes 2 500 000
Khalkha Langues mongoles 2 500 000
Barese Langues romanes 2 400 000
Guilaki Langues indo-iraniennes 2 400 000
Lugbara Langues nilo-sahariennes 2 400 000
Maharashtri konkani Langues indo-iraniennes 2 400 000
Pampangue (Kapampangan) Langues malayo-polynésiennes 2 400 000
Anaang (annang) Langues cross river 2 335 000
Mazandarani (tabari, geleki) Langues indo-iraniennes 2 320 000
Surjapuri Langues indo-iraniennes 2 256 228
Od (oad, odki) Langues indo-iraniennes 2 250 000
Kurukh (oraon, kuṛux) Langues dravidiennes 2 228 000
Lomwe Langues bantoues 2 211 000
Gusii (ekegusii) Langues bantoues 2 205 000
Soninké Langues mandées 2 201 000
Bas allemand (Plattdüütsch) Langues germaniques 2 200 000
Fon (fon-gbe) Langues voltaïco-nigériennes 2 200 000
Kumaoni Langues indo-iraniennes 2 200 000
Slovène Langues slaves 2 200 000
Makondé (chimakondé, chinimakondé, kondé) Langues bantoues 2 151 000
Chaoui Langues berbères 2 130 000
Makassar Langues malayo-polynésiennes 2 130 000
Sena Langues bantoues 2 126 000
Acholi (acoli, akoli, atscholi, log acoli, dok acoli) Langues nilo-sahariennes 2 100 000
Macédonien Langues slaves 2 050 000
Swati (siSwati) Langues bantoues 2 034 200
Gamo-gofa-dawro Langues omotiques 2 016 000
Batak toba Langues malayo-polynésiennes 2 000 000
Émilien Langues romanes 2 000 000
Meru (kimeru) Langues bantoues 2 000 000
Nuosu Langues lolo-birmanes 2 000 000
Romanesco Langues romanes 2 000 000
Tchétchène Langues nord-caucasiennes 2 000 000
Urhobo Langues voltaïco-nigériennes 2 000 000
Aymara Langues aymaranes 1 981 534
Afar Langues couchitiques 1 973 800
Tharu (tharuhat) Langues indo-iraniennes 1 930 000
Bicolano albay Langues malayo-polynésiennes 1 900 000
Kipsikis (kipsigis, lumbwa) Langues nilo-sahariennes 1 900 000
Mijikenda Langues bantoues 1 900 000
Bagri Langues indo-iraniennes 1 890 815
Khandeshi Langues indo-iraniennes 1 860 000
Temné Langues atlantiques 1 851 000
Teso (ateso) Langues nilo-sahariennes 1 849 000
Toulou (tulu) Langues dravidiennes 1 841 963
Agni (anyin) Langues kwa 1 816 400
Calabrais Langues romanes 1 800 000
Hani Langues lolo-birmanes 1 800 000
Karekare (karai-karai) Langues tchadiques 1 800 000
Memoni Langues indo-iraniennes 1 800 000
Rohingya (ruáingga) Langues indo-iraniennes 1 800 000
Tibétain de l'Amdo Langues tibéto-himalayennes 1 800 000
Meitei Langues naga 1 760 000
Letton (lette) Langues baltes 1 752 260
Tchokwé (chokwe) Langues bantoues 1 744 200
Surgujia Langues indo-iraniennes 1 738 256
Malinké de l'Ouest Langues mandées 1 733 000
Kabarde Langues nord-caucasiennes 1 712 000
Alur Langues nilo-sahariennes 1 700 000
Kangri Langues indo-iraniennes 1 700 000
Mundari Langues munda 1 661 656
Nahuatl (náhuatl huasteco) Langues uto-aztèques 1 651 958
Zazaki Langues indo-iraniennes 1 640 000
Ndébélé du Zimbabwe (ndébélé du Nord) Langues bantoues 1 634 800
Tày Langues taï-kadaï 1 630 000
Wolaitta Langues omotiques 1 630 000
Braj bhasha Langues indo-iraniennes 1 600 000
Édo (bini) Langues voltaïco-nigériennes 1 600 000
Kiga Langues bantoues 1 600 000
Dan (gio, yacouba) Langues mandées 1 577 000
Pangasinan Langues malayo-polynésiennes 1 560 000
Luba-katanga (luba-shaba) Langues bantoues 1 505 000
Ibibio Langues cross river 1 500 000
Maa (massaï, maasai, masaï) Langues nilo-sahariennes 1 500 000
Pa'o Langues karens 1 500 000
Rombo (kirombo) Langues bantoues 1 500 000
Salentin Langues romanes 1 500 000
Tonga (chitonga, zambezi) Langues bantoues 1 500 000
Mendé Langues mandées 1 499 700
Lampung pesisir (lampung api) Langues malayo-polynésiennes 1 477 000
Dhundari Langues indo-iraniennes 1 476 446
Nyamwezi Langues bantoues 1 470 000
Oshiwambo (ovambo) Langues bantoues 1 441 000
Kokborok Langues sal 1 411 294
Sérère Langues atlantiques 1 410 700
Boro (bodo) Langues sal 1 400 000
Bukusu Langues bantoues 1 400 000
Gogo Langues bantoues 1 400 000
Miao chuanqiandian (dont miao de Shuijingping, miao de Xinzhai...) Langues hmong-mien 1 400 000
Tibétain de Kham Langues tibéto-himalayennes 1 400 000
Chuwabu (chichwabo, chuabo, chuwabo) Langues bantoues 1 396 000
Abron (brong, bron, doma, gyaman) Langues kwa 1 393 000
Bachkir Langues turciques 1 379 700
Tamang Langues tibéto-himalayennes 1 370 154
Q'eqchi' (kekchi, kektxí) Langues mayas 1 370 007
Nyakyusa Langues bantoues 1 359 000
Dinka Langues nilo-sahariennes 1 352 120
Comorien (shikomori, shimasiwa) Langues bantoues 1 350 729
Piémontais Langues romanes 1 350 000
Sarde Langues romanes 1 350 000
Mandinka Langues mandées 1 346 000
Manyika Langues bantoues 1 334 000
Yaka Langues bantoues 1 331 000
Hadiyya Langues couchitiques 1 300 000
Haya (kihaya) Langues bantoues 1 300 000
Kam (dong du Sud) Langues taï-kadaï 1 300 000
Kpèllé (kpelle) Langues mandées 1 300 000
Limbourgeois Langues germaniques 1 300 000
Tchouvache Langues turciques 1 279 650
Bai Langues tibéto-birmanes 1 272 000
Hmu septentrional Langues hmong-mien 1 250 000
Batak dairi Langues malayo-polynésiennes 1 200 000
Batak simalungun Langues malayo-polynésiennes 1 200 000
Flamand occidental (westflamand) Langues germaniques 1 200 000
Ikwere (ikwerre) Langues voltaïco-nigériennes 1 200 000
Kabiyè Langues gour 1 200 000
Nyaneka (haneca) Langues bantoues 1 200 000
Tibétain central (dbus, ü-tsang) Langues tibéto-himalayennes 1 200 000
Vasavi Langues indo-iraniennes 1 200 000
Bedja Langues couchitiques 1 186 000
Tswa (xitswa) Langues bantoues 1 180 000
Garo Langues sal 1 145 323
Zandé Langues adamaoua-oubanguiennes 1 145 000
Muong Langues mon-khmer 1 140 000
Nsenga (senga) Langues bantoues 1 133 000
Estonien Langues ouraliennes 1 132 500
Venda (tshivenda) Langues bantoues 1 129 000
Parauk Langues mon-khmer 1 118 000
Batak mandailing Langues malayo-polynésiennes 1 100 000
Bhilali Langues indo-iraniennes 1 100 000
Flamand oriental Langues germaniques 1 100 000
Khortchin Langues mongoles 1 100 000
Maguindanao (maguindanaon) Langues malayo-polynésiennes 1 100 000
Quiché (k'iche') Langues mayas 1 100 000
Romagnol Langues romanes 1 100 000
Ndébélé du Transvaal (ndébélé du Sud) Langues bantoues 1 090 223
Créole mauricien Langues créoles (base lexicale française) 1 090 000
Dagaare (dagara) Langues gour 1 088 000
Ho Langues munda 1 077 000
Ndonga (oshindonga) Langues bantoues 1 070 000
Tausug Langues malayo-polynésiennes 1 062 000
Soso (soussou) Langues mandées 1 060 000
K'iche' (quiché) Langues amérindiennes 1 050 000
Tigré Langues sémitiques 1 050 000
Pwo de l'Est Langues karens 1 050 000
Khasi Langues mon-khmer 1 037 964
Kissi Langues atlantiques 1 035 000
Kutchi (katchi) Langues indo-iraniennes 1 031 000
Adangme (dangme, adangbe) Langues kwa 1 020 000
Gallois Langues celtiques 1 015 600
Turkana Langues nilo-sahariennes 1 013 000
Achomi (larestani) Langues indo-iraniennes 1 000 000
Arakanese (rakhine, marma) Langues lolo-birmanes 1 000 000
Bakhtiari Langues indo-iraniennes 1 000 000
Berom (birom) Langues platoïdes 1 000 000
Créole de Guinée-Bissau Langues créoles (base lexicale portugaise) 1 000 000
Créole trinidadien Langues créoles (base lexicale anglaise) 1 000 000
Gorontalo (hulontalo) Langues malayo-polynésiennes 1 000 000
Gujari (Gujri, gojari, gojri) Langues indo-iraniennes 1 000 000
Igala (igara) Langues voltaïco-nigériennes 1 000 000
Izon Langues ijo 1 000 000
Kisongye (kisonge, songe) Langues bantoues 1 000 000
Mahasu pahari Langues indo-iraniennes 1 000 000
Maranao Langues malayo-polynésiennes 1 000 000
Nasu Langues lolo-birmanes 1 000 000
Palatin Langues germaniques 1 000 000
Shaozhou tuhua Langues chinoises 1 000 000
Sources détaillées : recensements nationaux officiels ; Ethnologue: Languages of the World, Summer Institute of Linguistics ; Encyclopedia of Language and Linguistics, Ronald E. Asher (editor, 1994), Keith Brown (editor, 2006), Elsevier, 1994, 2006 (2nd edition) ; Nationalencyklopedin: Ett uppslagsverk på vetenskaplig grund utarbetat på initiativ av Statens kulturråd, NE Nationalencyklopedin AB, 2020.
Note(s) :
[1] Année indiquée ou dernière année pour laquelle des données sont disponibles.
[2] La langue anglaise serait comprise par environ 2 milliards de personnes. Cf. David Crystal, “Two Thousand Million?”, Cambridge University Press, English Today 24, n°1, 2008.
[3] L'hindi standard moderne et l’ourdou standard moderne sont mutuellement intelligibles et considérés par les linguistes comme des dialectes de la même langue. La distinction « officielle » est le résultat des tendances nationalistes respectives de l'Inde et du Pakistan. En 2020, l'hindi compte 295,25 millions de locuteurs natifs et 251,25 millions de locuteurs de langue seconde, soit un total de 546,5 millions de locuteurs ; tandis que l'ourdou regroupe 75,665 millions de locuteurs natifs et 153,095 millions de locuteurs de langue seconde, soit un total de 228,75 millions de locuteurs.
[4] Linguistiquement, la langue arabe est divisée en plusieurs dialectes, parfois très éloignés et qui ne permettent pas toujours une intelligibilité mutuelle. De plus, il existe une importante diglossie entre l'arabe littéral (langue véhiculaire principalement écrite) et les nombreux arabes dialectaux (langues vernaculaires principalement orales). Pour autant, la langue arabe est généralement considérée comme une langue unique en raison des facteurs géopolitiques, sociohistoriques et religieux.
[5] Le nombre de locuteurs du pendjabi diffère en raison des méthodes de comptage employées, allant de 113 à 125 millions de locuteurs natifs selon les sources. En effet, les linguistes ne parviennent pas à un consensus clair concernant les principaux dialectes du pendjabi (lahnda, majhi, doabi, malwai, powadhi, pothohari, multani…). Ainsi, le Summer Institute of Linguistics distingue le « pendjabi occidental » (dont les langues lahnda) parlé au Pakistan (65 millions de locuteurs natifs en 2021) du « pendjabi oriental » parlé en Inde (52 millions de locuteurs natifs en 2021). D'autres études suggèrent que le pendjabi occidental est au contraire une langue distincte des dialectes « lahnda » (Cf. George Abraham Grierson, Linguistic Survey of India, compiled and edited by George Abraham Grierson, Office of the Superintendent of Government Printing, Calcutta, India, 1903-1928). En outre, depuis le recensement national du Pakistan de 1981, le saraiki/seraiki (anciennement « lahnda du sud ») et l'hindko (auparavant rattachés au pendjabi occidental) ont le statut de langues distinctes du pendjabi. À l’échelle mondiale, les locuteurs natifs du pendjabi se répartissent comme suit : 80 540 000 au Pakistan (recensement de 2017), 33 124 726 en Inde (recensement de 2011), 501 680 au Canada (recensement de 2016), 280 000 aux États-Unis (cf. "US survey puts Punjabi speakers in US at 2.8 lakh", Times of India, 18 December 2017), 270 000 au Royaume-Uni (recensement de 2011), ainsi qu’un petit nombre de locuteurs dans d’autres pays. Enfin, le vocabulaire du « pendjabi moderne » est influencé par d'autres langues, notamment l'hindoustani, le persan, le sanskrit ou bien encore l'anglais.
[6] Estimation Atlasocio.com du nombre de francophones pour l'année 2020 selon la projection pour l’année correspondante (variante moyenne) de l'ONU (World Population Prospects: The 2019 Revision, Population Division, Department of Economic and Social Affairs, United Nations), croisée aux donnnées issues de l'ouvrage de Baptiste Beck, Richard Marcoux, Laurent Richard et Alexandre Wolff intitulé Estimation des populations francophones dans le monde en 2018 in Sources et démarches méthodologiques, Québec, Observatoire démographique et statistique de l’espace francophone, Université Laval, Rapport de recherche de l’ODSEF, 2018. À noter que l'État francophone le plus peuplé du monde est la République démocratique du Congo mais, étant donné que le français n'est pas parlé par l'ensemble de la population, la France demeure le pays comptant le plus grand nombre de francophones natifs.
[7] Le malais péninsulaire (langue officielle de la Malaisie et du Brunei) et l'indonésien (langue officielle de l'Indonésie), bien que considérés par certains linguistes comme étant des langues distinctes, présentent 80 % de vocabulaire commun. Aussi, les quelques divergences n'empêchent pas l'intercompréhension entre Malaisiens et Indonésiens. À noter que l'indonésien standard incorpore de nombreux apports de l'anglais, du néerlandais, du portugais, et des langues régionales indonésiennes, notamment du javanais.
[8] La langue min se compose de cinq variétés principales : le minnan (50 184 500 locuteurs natifs en 2019, dont 387 000 locuteurs de langue seconde), le minbei (10 304 000 locuteurs natifs en 1984), le mindong (10 297 520 locuteurs natifs en 2017), le minzhong (3 100 000 locuteurs natifs en 2000) et le puxian (2 558 800 locuteurs natifs en 2000). À noter toutefois que les différentes variétés de la langue min ne sont pas mutuellement intelligibles entre elles ainsi qu'avec les autres langues chinoises, d'où parfois des données distinctes pour chacune d'entre elles selon les sources.
[9] La langue italienne comprend l’italien « standard » issu du toscan de Florence, Pise et Sienne dont la grammaire est clairement définie et encadrée par un organisme de référence (Accademia della Crusca) ; des variantes régionales aux prononciations et aux accents différents mais dont les bases linguistiques proviennent toutes de l’italien standard et sont donc mutuellement intelligibles avec celui-ci ; ainsi que des dialectes qui sont quant à eux des langues différentes et mutuellement inintelligibles. Aussi, si l’italien demeure la langue maternelle majoritaire en Italie, l’utilisation de l'italien standard alterne dans certaines zones géographiques et dans différents segments de la population avec l'utilisation d'un dialecte ou d'une variante régionale. Ces éléments doivent être pris en considération afin d’expliquer notamment les « doublons » statistiques, inévitables pour le cas de la langue italienne et de ses dialectes. Ainsi, selon les sources, il existe des estimations très contradictoires sur le nombre d’italophones, tant pour définir le nombre total de locuteurs que pour tenter de déterminer le nombre de locuteur en tant que langue maternelle ou langue seconde. En additionnant l’italien standard (60 millions) avec l’ensemble des dialectes italiens, les estimations atteignent environ 85 millions de locuteurs.
[10] « Le zoulou (IsiZulu) est la langue du plus grand groupe ethnique de l'Afrique du Sud (22,7 %). C'est donc la langue sud-africaine la plus largement comprise » (Cf. J. Leclerc, « Afrique du Sud – (1) Généralités » in L'aménagement linguistique dans le monde, CEFAN, Université Laval, dernière mise à jour le 18 avril 2018).
[11] Le kannauji est une langue indo-aryenne parlée dans la région de Kannauj, au sein l'État de l'Uttar Pradesh en Inde. Le kannauji est étroitement apparenté à l'hindoustani, avec une similitude lexicale de 83 à 94 %. Certains linguistes le considèrent comme un dialecte de l'hindoustani, alors que d'autres le considèrent comme une langue distincte de l'hindi occidental.
[12] Il convient de ne pas confondre le q'eqchi' avec le k'iche' (quiché) qui sont deux langues mayas distinctes, ni de les associer avec le kichwa (quichua) rattaché au quechua. Concernant le nombre de locuteurs du quechua par État, plusieurs données sont disponibles :
– Pérou (recensement de 2017) : 3 799 780 locuteurs natifs (13,6 % de la population), bien que 5 176 809 personnes s'identifient comme ethniquement quechua (22,32 %) ;
– Bolivie (recensement de 2012) : 1 837 105 personnes se définissaient comme Quechuas, dont 1 613 210 parlaient la langue, soit 18 % de la population ;
– Argentine (selon l'Unesco en 2019) : 1 490 000 locuteurs natifs (dont 90 000 locuteurs natifs d'Argentine et environ 1 400 000 locuteurs natifs originaires de Bolivie et du Pérou) ;
– Équateur : 591 448 locuteurs natifs selon le recensement de 2010 et 724 721 locuteurs natifs selon une étude de 2020 (cf. Fernando Garcés Velásquez, Las comunidades virtuales del quichua ecuatoriano: revalorizando la lengua en un espacio apropiado [The Virtual Communities of the Ecuadorian Quichua: Revaluing the Language in an appropriated Space], Punto Cero v.25 n.40 Cochabamba sep. 2020) ;
– Chili (estimation de 2012) : 180 000 locuteurs dont la population migrante (les dernières données officielles sont de 6 175 locuteurs natifs selon le recensement de 2002 et de 33 868 personnes qui se sont identifiées comme Quechuas selon le recensement de 2017) ;
– Colombie : 15 450 locuteurs natifs en 2005 selon l'Organización Nacional Indígena de Colombia.
[13] « Lorsque l'on additionne les monolingues en guarani et les bilingues qui parlent cette langue, le chiffre atteint 87 % des locuteurs [du Paraguay]. » (Cf. « El 87 % de la población paraguaya habla guaraní », E'a Digital, Asunción, Paraguay, 6 Enero 2011 - Source : Censo Poblacional del Paraguay, Dirección General de Encuesta, Estadística y Censo, 2002).