Ako triediť textové súbory v systéme Linux pomocou príkazu sort

Ako triediť textové súbory v systéme Linux pomocou príkazu sort

Linux vám ponúka niekoľko nástrojov, ktoré môžete použiť na spracovanie textových súborov. Či už chcete odstrániť duplicitné údaje alebo triediť obsah v súbore, nástroje príkazového riadka systému Linux majú všetko, čo potrebujete.





Tento článok predvedie príkaz sort a ako ho môžete použiť na triedenie obsahu v textovom súbore a podľa toho ho usporiadať.





Čo je príkaz na triedenie?

Ako bolo uvedené vyššie, príkaz sort pomáha užívateľovi pri usporiadaní obsahu textového súboru v konkrétnom poradí. K dispozícii je niekoľko možností, ktoré vám umožňujú triediť súbor podľa vášho želania. Je to štandardný program Linux, ktorý dokáže zoradiť textový súbor podľa abecedy, číslice, stĺpca a ďalších v normálnom alebo opačnom poradí.





Medzi ďalšie funkcie príkazu patrí ignorovanie znakových znakov počas triedenia, triedenie súboru podľa mesiacov, ignorovanie medzier v súbore a náhodné triedenie. Pomocou triedenia môžete tiež skontrolovať, či je súbor už zoradený alebo nie.

Ako používať triedenie v systéme Linux

Napriek tomu, že triedenie obsahuje niekoľko metód a vlajok, ktoré môžete použiť, je ľahké sa ho naučiť.



Základná syntax

Základná syntax použitia triedenia je:

sort filename

...kde názov súboru je absolútna alebo relatívna cesta textového súboru, ktorý chcete triediť.





Triedenie v predvolenom nastavení usporiada obsah podľa nasledujúcich kritérií:

  1. Riadky začínajúce číselnými znakmi majú najvyššiu prioritu.
  2. Príkaz zoradí riadky podľa abecedy po zoradení riadkov začínajúcich číslami.
  3. Riadky začínajúce malými písmenami predchádzajú riadkom začínajúcim na rovnaký znak veľkými písmenami.

Predstavte si textový súbor s názvom textfile.txt obsahujúci nasledujúce informácie:





Ak chcete súbor zoradiť pomocou predvolenej konfigurácie:

sort textfile.txt

Výkon:

Vytvorte nový výstupný súbor

Príkaz sort nemení obsah súboru. Jednoducho pošle vytriedený obsah na štandardný výstup. To však neznamená, že triedením nemožno vytvoriť nový súbor. Môžete použiť -alebo príznak na zadanie názvu triedeného súboru a triedenie automaticky vytvorí súbor pre vás a pridá obsah.

ako začať blog na tumblr
sort -o sortedfile filename

...kde triedený súbor je názov výstupného súboru a názov súboru je pôvodný súbor, ktorý je potrebné triediť.

Triediť textfile.txt a vytvorte nový výstupný súbor pre obsah:

sort -o sorted.txt textfile.txt

Výkon:

Zoradiť viac súborov

Ak chcete zoradiť viac ako jeden súbor naraz, jednoducho zadajte názvy súborov oddelené príponou Vesmír charakter.

sort textfile.txt textfile2.txt

Výkon:

Všimnite si toho, že triedenie zlúči výstup súborov a zobrazí ich spoločne v termináli.

Obrátiť zoradenie súboru

Ak chcete zmeniť usporiadanie obsahu, použite -r vlajka s predvoleným príkazom. The -r v nasledujúcom príkaze znamená Reverz .

sort -r textfile.txt

Výkon:

Zoradiť súbor číselne

Na zoradenie súboru obsahujúceho číselné údaje použite -n vlajka s príkazom. V predvolenom nastavení usporiada zoradenie údaje vzostupne.

sort -n numbers.txt

Výkon:

Ak chcete zoradiť zostupne, zmeňte usporiadanie pomocou -r možnosť spolu s príponou -n vlajka v príkaze.

sort -rn numbers.txt

Výkon:

Pri triedení ignorujte veľkosť písmen

Štandardne triedenie zohľadňuje veľkosť znakov obsahu. Riadky začínajúce malými písmenami predchádzajú riadkom začínajúcim veľkými písmenami rovnakého znaku. Napríklad „on je chlapec“ bude predchádzať „On je chlapec“.

Ak chcete, aby triedenie ignorovalo veľké a malé písmena, zadajte -f alebo -púzdro na podpis označiť nasledovne:

sort -f textfile.txt
sort --ignore-case textfile.txt

Výkon:

Zoradiť súbor podľa mesiaca

Pomocou -M príznak, môžete zmeniť poradie obsahu súboru na základe názvov mesiacov.

sort -M textfile2.txt

Výkon:

Ignorujte vedúce medzery

Súbor, ktorý chcete zoradiť, môže niekedy obsahovať medzery alebo karty. Ak chcete ignorovať tieto prázdne znaky, použite -b vlajka.

sort -b fileblanks.txt

Výkon:

Zoradiť súbor podľa stĺpca

Ak máte textový súbor s údajmi usporiadanými do samostatných stĺpcov, môžete súbor zoradiť podľa obsahu stĺpca. Všetko, čo musíte urobiť, je odovzdať číslo stĺpca spolu s príponou -k vlajka.

Uvažujte o textovom súbore obsahujúcom informácie o súbore s rôznymi stĺpcami. Ak chcete triediť súbor s názvom output.txt podľa ôsmeho stĺpca:

obrázok nefunguje na MacBook Air
sort -k8 -rn output.txt

Výkon:

Potrubie zoradiť s inými príkazmi

Na úpravu usporiadania výstupu môžete dokonca použiť triedenie s inými príkazmi Linuxu. Ak chcete napríklad triediť výstup príkaz ls podľa veľkosti súborov:

ls -la | sort -k5 -rn

Výkon:

Zoradiť súbor náhodne

Môžete použiť -R príznak, ak chcete náhodne usporiadať poradie riadkov v textovom súbore. Zvážte súbor textfile.txt :

sort -R textfile.txt

Výkon:

Zoradiť čísla verzií do súboru

Ak máte k balíku textový súbor obsahujúci informácie o verzii, môžete jeho obsah zoradiť pomocou súboru -V alebo --verzia-triediť vlajka.

ako zistím ip adresu svojej tlačiarne
sort -V version.txt
sort --version-sort version.txt

Výkon:

Skontrolujte, či je súbor zoradený

The -c flag vám pomôže pri identifikácii súborov, ktoré sú už zoradené podľa uvedených možností. Ak je obsah súboru správne zoradený, zoradením sa nezobrazí žiadny výstup.

Ak chcete skontrolovať, či súbor textfile.txt je zoradené:

sort -c textfile.txt

Teraz súbor zoraďme a uložme jeho výstup do nového súboru s názvom triedený.txt . Pri zadaní nasledujúceho príkazu:

sort -c sorted.txt

Výkon:

Môžete tiež zadať rôzne príznaky na kontrolu usporiadania súboru podľa konkrétnych kritérií. Ak chcete napríklad skontrolovať, či súbor numbers.txt je zoradené zostupne:

sort -c -rn numbers.txt

Uvidíte výstup, že súbor nie je správne zoradený. Zoradíme súbor a skontrolujeme, či nový súbor prejde testom.

sort -o sorted.txt -rn numbers.txt
sort -c -rn sorted.txt

Výkon:

Zoradiť súbor a odstrániť duplikáty

Súbor, s ktorým pracujete, môže obsahovať duplicitné údaje. Aj keď môžete použiť príkaz uniq na odstránenie týchto informácií zo súboru môže túto úlohu vykonať triedenie. The -u alebo -unikátne vlajka je to, čo potrebujete.

Predstavte si súbor s názvom duplicate.txt :

Ak chcete súbor zoradiť a odstrániť opakované údaje:

sort -u duplicate.txt

Výkon:

Môžete to vidieť, keď použijete -u príznak, zoradenie zobrazí iba odlišné riadky a usporiada ich podľa zadaných kritérií.

Práca s textovými súbormi v systéme Linux

Aj keď je výkonnosť textových editorov príkazového riadka neporovnateľná, stále sa môžete rozhodnúť pre grafický editor, ako je napríklad gedit, na jednoduchú úpravu obsahu textového súboru. Je to tiež lepšia voľba pre tých, ktorí sú v Linuxe noví a nedokážu si poradiť s terminálom.

Najlepším spôsobom, ako začať s príkazovým riadkom a Linuxom vo všeobecnosti, je najskôr si precvičiť základné príkazy. Po pokrytí základných nástrojov je pravdepodobne najlepším prístupom postupný postup k zložitejším príkazom.

zdieľam zdieľam Tweet E -mail Cheat Sheet pre Linux

Tento jednoduchý cheat vám pomôže rýchlo si vybaviť terminál príkazového riadka Linuxu.

Čítajte ďalej
Súvisiace témy
  • Linux
  • Správa súborov
  • Linux
  • Príkazy Linux
O autorovi Deepesh Sharma(79 publikovaných článkov)

Deepesh je juniorský editor pre Linux na MUO. Píše informačné príručky pre systém Linux s cieľom poskytnúť všetkým novým záujemcom blažený zážitok. Nie ste si istí filmami, ale ak chcete hovoriť o technológiách, je to váš chlap. Vo svojom voľnom čase ho môžete nájsť pri čítaní kníh, počúvaní rôznych hudobných žánrov alebo hre na gitare.

Viac od Deepesh Sharmy

prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu a získajte technické tipy, recenzie, bezplatné elektronické knihy a exkluzívne ponuky!

Kliknutím sem sa prihlásite na odber