Berkeley DB

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 12. August 2008 um 13:26 Uhr durch DirkDe (Diskussion | Beiträge) (Fixed broken sourceforge link). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Zur Navigation springen Zur Suche springen
Berkeley DB
Basisdaten

Entwickler Oracle
Erscheinungsjahr 1992
Aktuelle Version 5.4
Betriebssystem Unix, Linux, Windows, AIX,Sun Solaris, SCO Unix, Mac OS
Programmier­sprache C, Programmierschnittstelle
Kategorie Datenbankmanagementsystem
Lizenz Duales Lizenzsystem (Kommerziell und Sleepycat)
www.oracle.com/database/berkeley-db/db/index.html

Die Berkeley-Datenbank (Berkeley DB) ist eine eingebettete Datenbank-Bibliothek mit Programmierschnittstellen zu C, C++, Java, Perl, Python, Tcl und weiteren Programmiersprachen.

Die Berkeley DB wurde von Sleepycat Software entwickelt. 2006 wurde Sleepycat durch Oracle aufgekauft[1].

Eigenschaften

Berkeley DB läuft auf einer großen Anzahl von Betriebssystemen, unter anderem auf den meisten UNIX-artigen und Windows-Systemen und auch Echtzeitbetriebssystemen.

Die Berkeley DB enthält Kompatibilitätsschnittstellen für einige historische UNIX Datenbank-Bibliotheken wie dbm, ndbm und hsearch.

Für die Verwendung in Java-Systemen wird eine Berkeley DB Java Edition angeboten, die als einzelne JAR-Datei in einer virtuellen Java-Maschine eingebunden werden kann. Sie bietet die selben Funktionen wie die in C geschriebene Berkeley DB.

Berkeley DB XML ist ein Interface, das die Speicherung von XML-Daten in der in C geschriebenen Berkeley DB unterstützt. Dadurch können XML-Dokumente geparst werden, und die Abfrage-Sprachen XPath und XQuery für Datenzugriffe genutzt werden.

Die Berkeley DB speichert Datensätze bestehend aus einem Schlüssel- und einem Datenteil. Eine weitere Strukturierung der Daten als einzelne Tabellenspalten mit bestimmten Datentypen wird nicht unterstützt.

Es gibt keine SQL-Schnittstelle, mit der auf die gespeicherten Daten zugegriffen werden kann. Berkeley DB ist ausschließlich für die Verwendung als Eingebettetes Datenbanksystem konzipiert. Programme können die Datenbank nur durch prozessinterne API-Aufrufe verwenden, vergleichbar mit Zugriffen auf ein Dateisystem. Dadurch unterliegen die Programme, die die Berkeley DB als Datenspeicher verwenden, keiner Einschränkungen, in welcher Weise die Daten in einem Datensatz abgelegt werden. Ein Datensatz und sein zugehöriger Schlüssel kann bis zu vier Gigabyte groß sein. Eine Tabelle kann bis zu 256 Terabyte Speicher belegen.

Im Gegensatz zu einem Dateisystem bietet die Berkeley DB viele Funktionen, die ein Datenbanksystem charakterisieren. Sie bietet simultane Threads zum Manipulieren der Daten. Sie bietet Transaktionssicherheit für lesende und schreibende Zugriffe, Lock-Mechanismen, eine XA-Schnittstelle, Backups zur Laufzeit (Hot-Backup) und Replikation.

Die Berkeley DB benutzt den selben Adressraum, den auch die Anwendung verwendet, in die die Datenbank eingebettet ist. Das bedeutet einen Performance-Vorteil gegenüber großen Server-DBMS, die die angeforderten Daten vom permanenten Speichermedium erst in den eigenen Arbeitsspeicher lesen müssen und dann an den Adressraum der Anwendung übergeben muss. Mit einer Größe des Maschinencodes von weniger als 500KB eignet sich die Berkeley DB auch gut für den Einsatz in Systemen mit einer schwachen Rechnerleistung.

Berkeley DB bietet zwar selbst keine Schnittstellen für Netzwerk-Zugriffe, besitzt aber Replikations-Funktionen für den Einsatz z.B. auf Bladeservern. Ein Blade-Computer fungiert dabei als Master, der Datenänderungen entgegennimmt und diese auf die Replika-Blades verteilt. Dadurch entsteht eine hohe Ausfallsicherheit des Gesamtsystems. Nach Angaben des Herstellers kann durch die Replikation eine 99,999%ige Verfügbarkeit des Gesamtsystems erreicht werden.

Weil die Berkerley DB nicht den Overhead einer großen Server-DB hat, ist auch die erforderliche Administration sehr einfach. Die Datenbank kann sehr variabel konfiguriert werden. Sie ist besonders gut geeignet für den Einsatz in geschlossenen Systemen, die überhaupt keine Administration erfordern bzw. ermöglichen. Bei einem Fehler des Systems startet sich das System selbständig neu und die Betriebsfähigkeit ist in den meisten Fällen wieder hergestellt.

Produkte, die Berkeley DB verwenden

Berkeley DB wird nach Angaben von Oracle mehr als 200 Millionen mal eingesetzt[2], unter anderem von namhaften Telekommunikations-, Netzwerk- und Hardwareanbietern:

Berkeley DB wird häufig in folgenden Systemen eingesetzt:

Nachfolgend eine Liste von beachtenswerten Programmen, die Berkeley DB zur Datenspeicherung verwenden:

Lizenzierung

Die Versionen 2.0 und höher von Berkeley DB sind unter einer Duallizenz[3] verfügbar. Man hat die Wahl zwischen einer kommerziellen Lizenz und einer Open-Source-Lizenz. Nutzer, die die DB mit proprietärer Software ausliefern wollen, müssen sie lizenzieren.

Die Versionen vor 2.0 stehen unter der BSD-Lizenz, womit sie auch kommerziell frei genutzt werden können.

Quellen

  1. Oracle Buys Open Source Software Company Sleepycat
  2. Oracle Unveils Oracle Berkeley DB Release 4.5
  3. Oracle Berkeley DB Licensing Information (engl.)