UUID-Format: 8-4-4-4-12 - Warum?

83

Warum werden UUIDs im Format "8-4-4-4-12" (Ziffern) dargestellt? Ich habe mich nach dem Grund umgesehen, kann aber die Entscheidung nicht finden, die dies erfordert.

Beispiel für eine als Hex-Zeichenfolge formatierte UUID: 58D5E212-165B-4CA0-909B-C86B9CEE0111

Fidel
quelle
10
Tatsächlich ist dieses Hex-String-Beispiel falsch. Die UUID spec erfordert , dass die hex Zeichenfolge , die einen UUID Wert muss in seinen Kleinbuchstabe . Die Spezifikation erfordert auch eine Implementierung, um eine Zeichenfolge in Groß- oder Großbuchstaben analysieren zu können, es können jedoch nur Kleinbuchstaben generiert werden. Leider verstoßen gängige Implementierungen gegen diese Regel, einschließlich der von Apple, Microsoft und anderen.
Basil Bourque
Interessanter Basil, danke
Fidel

Antworten:

64

Es ist durch getrennt time, version, clock_seq_hi, clock_seq_lo, node, wie im folgenden RFC angegeben.

Aus dem IETF RFC4122:

4.1.2.  Layout and Byte Order

   To minimize confusion about bit assignments within octets, the UUID
   record definition is defined only in terms of fields that are
   integral numbers of octets.  The fields are presented with the most
   significant one first.

   Field                  Data Type     Octet  Note
                                        #

   time_low               unsigned 32   0-3    The low field of the
                          bit integer          timestamp

   time_mid               unsigned 16   4-5    The middle field of the
                          bit integer          timestamp

   time_hi_and_version    unsigned 16   6-7    The high field of the
                          bit integer          timestamp multiplexed
                                               with the version number  

   clock_seq_hi_and_rese  unsigned 8    8      The high field of the
   rved                   bit integer          clock sequence
                                               multiplexed with the
                                               variant

   clock_seq_low          unsigned 8    9      The low field of the
                          bit integer          clock sequence

   node                   unsigned 48   10-15  The spatially unique
                          bit integer          node identifier

   In the absence of explicit application or presentation protocol
   specification to the contrary, a UUID is encoded as a 128-bit object,
   as follows:

   The fields are encoded as 16 octets, with the sizes and order of the
   fields defined above, and with each field encoded with the Most
   Significant Byte first (known as network byte order).  Note that the
   field names, particularly for multiplexed fields, follow historical
   practice.

   0                   1                   2                   3
    0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                          time_low                             |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |       time_mid                |         time_hi_and_version   |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |clk_seq_hi_res |  clk_seq_low  |         node (0-1)            |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
   |                         node (2-5)                            |
   +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Matten
quelle
11
Warum wurde der Zeitstempel in drei Teile geteilt?
user253751
4
Wie die Felder generiert werden, hängt von der UUID-Version ab. Die bevorzugte Methode verwendet keine Zeit, da dadurch die Zeit angezeigt wird, zu der die ID generiert wurde (ein potenzielles Sicherheitsrisiko). en.wikipedia.org/wiki/…
pmont
1
@pmont "Bevorzugt"?
Basil Bourque
2
@brocoli Ich muss nicht zustimmen. V4 hängt von einem kryptografisch starken Zufallszahlengenerator ab, dessen Erstellung viel schwieriger ist, als nur die MAC-Adresse , den aktuellen Moment und eine inkrementelle beliebige Zahl zu ermitteln, wie in V1 UUID dargestellt. Darüber hinaus sind die Implementierungen von V1 im Allgemeinen Open Source und wurden vor vielen Jahren mit viel Einsatz in der gesamten Branche entwickelt und sind mittlerweile abgenutzt. Die Behauptung, V1 sei "anfällig für teilweisen Ausfall", ist einfach albern. Eine V1-UUID ist das letzte Teil Ihres Systems, in dem Sie sich über Fehler Gedanken machen müssen.
Basil Bourque
2
@BasilBourque Eines der Probleme, die Sie jetzt bei der Verbreitung von Containern und der Containernetzwerke sehen können, sind kollidierende MAC-Adressen. In der Regel werden Container und VMs aus einem begrenzten Bereich möglicher MAC-Adressen abgerufen. IIRC Hyper-V zieht standardmäßig nur aus einem Pool von 256 möglichen MAC-Adressen.
Nathan Clayton
12

Das Format ist in Abschnitt 3 in IETF RFC4122 definiert . Das Ausgabeformat wird dort definiert, wo "UUID = ..." steht.

3.- Namespace-Registrierungsvorlage

Namespace-ID: UUID-Registrierungsinformationen: Registrierungsdatum: 2003-10-01

Erklärter Registrant des Namespace: JTC 1 / SC6 (ASN.1 Rapporteur Group)

Erklärung der syntaktischen Struktur: Eine UUID ist eine räumlich und zeitlich eindeutige Kennung in Bezug auf den Raum aller UUIDs. Da eine UUID eine feste Größe hat und ein Zeitfeld enthält, können Werte verschoben werden (um AD 3400, abhängig vom verwendeten spezifischen Algorithmus). Eine UUID kann für verschiedene Zwecke verwendet werden, von der Kennzeichnung von Objekten mit extrem kurzer Lebensdauer bis zur zuverlässigen Identifizierung sehr persistenter Objekte in einem Netzwerk.

  The internal representation of a UUID is a specific sequence of
  bits in memory, as described in Section 4.  To accurately
  represent a UUID as a URN, it is necessary to convert the bit
  sequence to a string representation.

  Each field is treated as an integer and has its value printed as a
  zero-filled hexadecimal digit string with the most significant
  digit first.  The hexadecimal values "a" through "f" are output as
  lower case characters and are case insensitive on input.

  The formal definition of the UUID string representation is
  provided by the following ABNF [7]:

  UUID                   = time-low "-" time-mid "-"
                           time-high-and-version "-"
                           clock-seq-and-reserved
                           clock-seq-low "-" node
  time-low               = 4hexOctet
  time-mid               = 2hexOctet
  time-high-and-version  = 2hexOctet
  clock-seq-and-reserved = hexOctet
  clock-seq-low          = hexOctet
  node                   = 6hexOctet
  hexOctet               = hexDigit hexDigit
  hexDigit =
        "0" / "1" / "2" / "3" / "4" / "5" / "6" / "7" / "8" / "9" /
        "a" / "b" / "c" / "d" / "e" / "f" /
        "A" / "B" / "C" / "D" / "E" / "F"
Paul-Joseph de Werk
quelle
4

128 Bit

Das "8-4-4-4-12" -Format ist nur zum Lesen durch Menschen gedacht. Die UUID ist wirklich eine 128-Bit- Zahl.

Beachten Sie, dass das Zeichenfolgenformat beim Speichern oder im Speicher das Doppelte der Bytes als die 128-Bit-Zahl erfordert. Ich würde vorschlagen, die Nummer intern zu verwenden. Wenn sie auf einer Benutzeroberfläche angezeigt oder in eine Datei exportiert werden muss, verwenden Sie das Zeichenfolgenformat.

Pablo Pazos
quelle