So zählen Sie Zeilen, die nach dem ersten Feld in Bash sortiert sind

9

Hier ist ein Ausschnitt aus dem INPUT:

...
####################
Bala Bela;XXXXXX12345;XXXXXX12345678;A
SERVER345Z3.DOMAIN.com0
SERVER346Z3.DOMAIN.com0
SERVER347Z3.DOMAIN.com0
SERVER348Z3.DOMAIN.com0
ssh-dss ...pubkeyhere...
####################
Ize Jova;XXXXXX12345;XXXXXX12345;A
SERVER342Z3.DOMAIN.com0
SERVER343Z3.DOMAIN.com0
SERVER345Z3.DOMAIN.com0
ssh-rsa ...pubkeyhere...
...

Und hier ist ein Ausschnitt aus dem OUTPUT, den ich brauche:

Bala Bela;XXXXXX12345;XXXXXX12345678;A
4
Ize Jova;XXXXXX12345;XXXXXX12345;A
3

Ich benötige also einen AUSGANG vom EINGANG, damit ich sehen kann, wie viele Zeilen, die mit "SERVER" beginnen, an einen bestimmten Benutzer gehen (Beispiel: "Bala Bela; XXXXXX12345; XXXXXX12345678; A"). Wie kann ich das in Bash machen?

gasko peter
quelle
Benötigen Sie dies als eigenständiges Bash oder sind andere Tools akzeptabel (grep, awk, perl ...)?
ire_and_curses
Ich würde annehmen (und habe dies getan :), dass eine Bash-Scripting-Frage, sofern nicht ausdrücklich anders angegeben, alle Standard-Tools wie grep, awk, sed, perl und alle anderen zulässt.
Cas

Antworten:

6
{
i=0
while IFS= read -r line; do
  case "$line" in
    ssh*|'##'*)
      ;;
    SERVER*)
      ((++i))
      ;;
    *)
      if ((i>0)); then echo $i;i=0; fi
      echo "$line"
      ;;
  esac
done
if ((i>0)); then echo $i;i=0; fi
} <inputfile >outputfile

Das gleiche gilt für Perl-Einzeiler

perl -nle '
  BEGIN{$i=0}
  next if/^(ssh|##)/;
  if(/^SERVER/){++$i;next}
  print$i if$i>0;
  $i=0;
  print;
  END{print$i if$i>0}' inputfile >outputfile

und Golf gespielt

perl -nle's/^(ssh|##|(SERVER))/$2&&$i++/e&&next;$i&&print$i;$i=!print}{$i&&print$i' inputfile >outputfile
Nahuel Fouilleul
quelle
Wow. Perl ist erstaunlich: D
Gasko Peter
5

Diese Version zählt alle Zeilen, die nicht mit dem regulären Ausdruck in der grepZeile übereinstimmen .

#! /usr/bin/perl 

# set the Input Record Separator (man perlvar for details)
$/ = '####################';

while(<>) {
    # split the rows into an array
    my @rows = split "\n";

    # get rid of the elements we're not interested in
    @rows = grep {!/^#######|^ssh-|^$/} @rows;

    # first row of array is the title, and "scalar @rows"
    # is the number of entries, so subtract 1.
    if (scalar(@rows) gt 1) {
      print "$rows[0]\n", scalar @rows -1, "\n"
    }
}

Ausgabe:

Bala Bela, XXXXXX12345, XXXXXX12345678, A.
4
Ize Jova, XXXXXX12345, XXXXXX12345, A.
3

Wenn Sie nur Zeilen zählen möchten, die mit 'SERVER' beginnen, dann:

#! /usr/bin/perl 

# set the Input Record Separator (man perlvar for details)
$/ = '####################';

while(<>) {
    # split the rows into an array
    my @rows = split "\n";

    # $rows[0] will be same as $/ or '', so get title from $rows[1]
    my $title = $rows[1];

    my $count = grep { /^SERVER/} @rows;

    if ($count gt 0) {
      print "$title\n$count\n"
    }
}
cas
quelle
5
sed -n ':a /^SERVER/{g;p;ba}; h' file | uniq -c | 
  sed -r 's/^ +([0-9]) (.*)/\2\n\1/'

Ausgabe:

Bala Bela;XXXXXX12345;XXXXXX12345678;A
4
Ize Jova;XXXXXX12345;XXXXXX12345;A
3

Wenn eine vorangestellte Zählung in Ordnung ist:

sed -n ':a /^SERVER/{g;p;ba}; h' file |uniq -c

Ausgabe:

  4 Bala Bela;XXXXXX12345;XXXXXX12345678;A
  3 Ize Jova;XXXXXX12345;XXXXXX12345;A
Peter.O
quelle
4

Eine awkAlternative:

/^#{15,}/ {           # if line starts with 15 or more number signs
  if(k) {             # if any key found
    print k RS n      # print it and occurrences of SERVER
    n=0
  }
  getline             # key is on the next line
  k = $0
  next                # move to next record
} 

/SERVER/ { n++ }      # count occurrences of SERVER
END { print k RS n }  # print last record

Alles in einer Zeile:

awk '/^#{15,}/ { if(n>0) { print k RS n; n=0 }; getline; k = $0; next } /SERVER/ { n++ } END { print k RS n }'
Thor
quelle
2

Wenn die Ausgabe bereits in jedem "Bucket" sortiert ist, können Sie uniq direkt anwenden, indem Sie nur die ersten N Zeichen überprüfen:

cat x | uniq -c -w6

Hier ist N == 6, da SERVER aus 6 Zeichen vom Zeilenanfang besteht. Sie erhalten diese Ausgabe (die sich ein wenig von Ihrer erforderlichen Ausgabe unterscheidet):

  1 ####################
  1 Bala Bela;XXXXXX12345;XXXXXX12345678;A
  4 SERVER345Z3.DOMAIN.com0
  1 ssh-dss ...pubkeyhere...
  1 ####################
  1 Ize Jova;XXXXXX12345;XXXXXX12345;A
  3 SERVER342Z3.DOMAIN.com0
  1 ssh-rsa ...pubkeyhere...
Mathematik
quelle