Language Phylogeny from Harmonic Cycle Catalogue

Method: Jaccard distance on top-20 trigram rotation cycles, UPGMA clustering Languages: 49

Dendrogram

└── [d=0.988]
    ├── [d=0.972]
    │   ├── [d=0.947]
    │   │   ├── sv (Swedish)
    │   │   └── [d=0.919]
    │   │       ├── no (Norwegian)
    │   │       └── da (Danish)
    │   └── [d=0.969]
    │       ├── [d=0.919]
    │       │   ├── lt (Lithuanian)
    │       │   └── [d=0.857]
    │       │       ├── id (Indonesian)
    │       │       └── ms (Malay)
    │       └── [d=0.919]
    │           ├── fi (Finnish)
    │           └── lv (Latvian)
    └── [d=0.986]
        ├── [d=0.977]
        │   ├── [d=0.889]
        │   │   ├── cs (Czech)
        │   │   └── sk (Slovak)
        │   └── [d=0.956]
        │       ├── pl (Polish)
        │       └── [d=0.933]
        │           ├── de (German)
        │           └── [d=0.889]
        │               ├── fr (French)
        │               └── la (Latin)
        └── [d=0.983]
            ├── [d=0.979]
            │   ├── [d=0.977]
            │   │   ├── [d=0.933]
            │   │   │   ├── cy (Welsh)
            │   │   │   └── [d=0.919]
            │   │   │       ├── ga (Irish)
            │   │   │       └── tl (Tagalog)
            │   │   └── [d=0.968]
            │   │       ├── [d=0.919]
            │   │       │   ├── nl (Dutch)
            │   │       │   └── fa (Persian)
            │   │       └── [d=0.961]
            │   │           ├── en (English)
            │   │           └── [d=0.945]
            │   │               ├── it (Italian)
            │   │               └── [d=0.916]
            │   │                   ├── bg (Bulgarian)
            │   │                   └── [d=0.857]
            │   │                       ├── es (Spanish)
            │   │                       └── pt (Portuguese)
            │   └── [d=0.977]
            │       ├── [d=0.961]
            │       │   ├── tr (Turkish)
            │       │   └── [d=0.889]
            │       │       ├── my (Burmese)
            │       │       └── sr (Serbian)
            │       └── [d=0.961]
            │           ├── hr (Croatian)
            │           └── [d=0.889]
            │               ├── et (Estonian)
            │               └── uz (Uzbek)
            └── [d=0.980]
                ├── [d=0.947]
                │   ├── hu (Hungarian)
                │   └── [d=0.919]
                │       ├── ro (Romanian)
                │       └── sw (Swahili)
                └── [d=0.976]
                    ├── zh (Chinese)
                    └── [d=0.974]
                        ├── ko (Korean)
                        └── [d=0.966]
                            ├── [d=0.919]
                            │   ├── th (Thai)
                            │   └── [d=0.889]
                            │       ├── vi (Vietnamese)
                            │       └── hi (Hindi)
                            └── [d=0.955]
                                ├── [d=0.933]
                                │   ├── te (Telugu)
                                │   └── [d=0.919]
                                │       ├── ta (Tamil)
                                │       └── ar (Arabic)
                                └── [d=0.939]
                                    ├── [d=0.904]
                                    │   ├── ja (Japanese)
                                    │   └── [d=0.857]
                                    │       ├── uk (Ukrainian)
                                    │       └── mn (Mongolian)
                                    └── [d=0.913]
                                        ├── [d=0.888]
                                        │   ├── ka (Georgian)
                                        │   └── [d=0.857]
                                        │       ├── ru (Russian)
                                        │       └── he (Hebrew)
                                        └── [d=0.889]
                                            ├── el (Greek)
                                            └── bn (Bengali)

Distance Matrix (condensed — 20 closest pairs)

Pair Jaccard d Languages
es-bg 0.857 Spanish - Bulgarian
es-pt 0.857 Spanish - Portuguese
id-ms 0.857 Indonesian - Malay
ru-he 0.857 Russian - Hebrew
ru-ka 0.857 Russian - Georgian
uk-he 0.857 Ukrainian - Hebrew
uk-mn 0.857 Ukrainian - Mongolian
cs-sk 0.889 Czech - Slovak
el-bn 0.889 Greek - Bengali
el-he 0.889 Greek - Hebrew
el-ka 0.889 Greek - Georgian
et-uz 0.889 Estonian - Uzbek
fr-la 0.889 French - Latin
he-ar 0.889 Hebrew - Arabic
he-bn 0.889 Hebrew - Bengali
my-sr 0.889 Burmese - Serbian
pt-it 0.889 Portuguese - Italian
ro-ru 0.889 Romanian - Russian
uk-ar 0.889 Ukrainian - Arabic
uk-ja 0.889 Ukrainian - Japanese

Family Coherence

Germanic

Romance

Slavic

Balkan Sprachbund

Languages: bg (Bulgarian), ro (Romanian), el (Greek), sr (Serbian)

Pairwise distances:

Pair d
bg-ro 0.974
bg-el 0.947
bg-sr 0.974
ro-el 1.000
ro-sr 0.974
el-sr 0.919