Database API Reference¶

Complete API reference for working with ArcadeDB databases in Python.

DSL-first usage

For application code and examples, prefer SQL/OpenCypher via db.command(...) and db.query(...). This page also documents wrapper/object methods for compatibility and low-level API completeness.

Module Functions¶

create_database¶

arcadedb.create_database(path: str) -> Database

Create a new database at the specified path.

Parameters:

path (str): File system path where the database will be created

Returns:

Database: Database instance

Raises:

ArcadeDBError: If database creation fails or path already exists

Example:

import arcadedb_embedded as arcadedb

with arcadedb.create_database("./mydb") as db:
    db.command("sql", "CREATE DOCUMENT TYPE Person")
    db.command("sql", "CREATE PROPERTY Person.name STRING")

Use Context Manager

Prefer using with statement for automatic cleanup:

with arcadedb.create_database("./mydb") as db:
    # Database automatically closed on exit
    pass

open_database¶

arcadedb.open_database(path: str) -> Database

Open an existing database.

Parameters:

path (str): Path to the existing database

Returns:

Database: Database instance

Raises:

ArcadeDBError: If database doesn't exist or can't be opened

Example:

with arcadedb.open_database("./mydb") as db:
    result = db.query("sql", "SELECT FROM Person")
    print(f"Found {len(list(result))} records")

database_exists¶

arcadedb.database_exists(path: str) -> bool

Check if a database exists at the given path.

Parameters:

path (str): Path to check

Returns:

bool: True if database exists, False otherwise

Example:

if arcadedb.database_exists("./mydb"):
    db = arcadedb.open_database("./mydb")
else:
    db = arcadedb.create_database("./mydb")

Database Class¶

The main database interface for executing queries, managing transactions, and creating records.

Constructor¶

Database(java_database)

Parameters:

java_database: Java Database object (internal use - use factory functions instead)

Direct Construction

Don't create Database instances directly. Use create_database(), open_database(), or DatabaseFactory instead.

query¶

db.query(language: str, command: str, *args) -> ResultSet

Execute a query and return results. Queries are read-only and don't require a transaction.

Parameters:

language (str): Query language - "sql", "opencypher", "mongo", "graphql"
command (str): Query string
*args: Optional parameters to bind to the query

Returns:

ResultSet: Iterable result set

Raises:

ArcadeDBError: If query fails or database is closed

Example:

# Simple query
result = db.query("sql", "SELECT FROM Person WHERE age > 25")
for record in result:
    print(record.get('name'))

# Parameterized query
result = db.query("sql", "SELECT FROM Person WHERE age > ?", 25)

# OpenCypher query
result = db.query("opencypher", """
    MATCH (p:Person)-[:Knows]->(friend)
    WHERE p.age > $min_age
    RETURN friend.name
""", {"min_age": 25})

Supported Languages:

Language	Notes
`sql`	ArcadeDB SQL
`opencypher`	OpenCypher graph query language
`mongo`	MongoDB query syntax
`graphql`	GraphQL queries

command¶

db.command(language: str, command: str, *args) -> Optional[ResultSet]

Execute a command (write operation). Commands modify data and require a transaction.

Parameters:

language (str): Command language (usually "sql" or "opencypher")
command (str): Command string
*args: Optional parameters

Returns:

ResultSet or None: Result set if command returns data, None otherwise

Raises:

ArcadeDBError: If command fails, database is closed, or no transaction is active

Example:

# Schema operations
db.command("sql", "CREATE DOCUMENT TYPE Person")
db.command("sql", "CREATE PROPERTY Person.name STRING")
db.command("sql", "CREATE PROPERTY Person.age INTEGER")

# Data operations must be in a transaction
with db.transaction():
    db.command("sql", "INSERT INTO Person SET name = ?, age = ?", "Alice", 30)
    db.command("sql", "UPDATE Person SET age = 31 WHERE name = 'Alice'")
    db.command("sql", "DELETE FROM Person WHERE name = 'Alice'")

Transaction Required

Write operations must be wrapped in a transaction:

# ✅ Correct
with db.transaction():
    db.command("sql", "INSERT INTO Person SET name = 'Alice'")

# ❌ Will fail
db.command("sql", "INSERT INTO Person SET name = 'Alice'")

transaction¶

db.transaction() -> TransactionContext

Create a transaction context manager.

Returns:

TransactionContext: Context manager for transaction

Example:

with db.transaction():
    for name in ["Alice", "Bob"]:
        db.command("sql", "INSERT INTO Person SET name = ?", name)
    # Automatic commit on success, rollback on exception

Manual Transaction Control:

# Alternative: manual control
db.begin()
try:
    for name in ["Alice", "Bob"]:
        db.command("sql", "INSERT INTO Person SET name = ?", name)
    db.commit()
except Exception as e:
    db.rollback()
    raise

begin¶

db.begin()

Begin a new transaction. Prefer using transaction() context manager.

Raises:

ArcadeDBError: If transaction cannot be started

commit¶

db.commit()

Commit the current transaction.

Raises:

ArcadeDBError: If commit fails or no transaction is active

rollback¶

db.rollback()

Rollback the current transaction.

Raises:

ArcadeDBError: If rollback fails

new_vertex¶

db.new_vertex(type_name: str) -> MutableVertex

Create a new vertex (graph node). Requires a transaction.

Parameters:

type_name (str): Vertex type name (must be defined in schema)

Returns:

MutableVertex: Java vertex object with .set(), .save() methods

Raises:

ArcadeDBError: If type doesn't exist or transaction not active

Example:

with db.transaction():
    vertex = db.new_vertex("Person")
    vertex.set("name", "Alice")
    vertex.set("age", 30)
    vertex.save()

    print(f"Created: {vertex.get_rid()}")

Creating Edges

There is no db.new_edge() method. Edges are created from vertices:

edge = vertex1.new_edge("Knows", vertex2)
edge.save()

See Graph Operations for details.

new_document¶

db.new_document(type_name: str) -> MutableDocument

Create a new document (non-graph record). Requires a transaction.

Parameters:

type_name (str): Document type name

Returns:

MutableDocument: Java document object

Example:

with db.transaction():
    doc = db.new_document("Person")
    doc.set("name", "Alice")
    doc.set("email", "alice@example.com")
    doc.save()

lookup_by_rid¶

db.lookup_by_rid(rid: str) -> Any

Lookup a record by its RID.

Parameters:

rid (str): Record ID string (e.g. "#10:5")

Returns:

Record object (Vertex, Document, or Edge) or None if not found

Example:

record = db.lookup_by_rid("#10:5")
if record:
    print(record.get("name"))

lookup_by_key¶

db.lookup_by_key(type_name: str, keys: List[str], values: List[Any]) -> Optional[Record]

Lookup a record by an indexed key (O(1) index-based lookup).

Parameters:

type_name (str): Type name
keys (List[str]): Indexed property names
values (List[Any]): Values for the indexed properties

Returns:

Record (Vertex/Document/Edge) or None if not found

Example:

db.command("sql", "CREATE VERTEX TYPE User")
db.command("sql", "CREATE PROPERTY User.email STRING")
db.command("sql", "CREATE INDEX ON User (email) UNIQUE")

with db.transaction():
    db.new_vertex("User").set("email", "alice@example.com").save()

found = db.lookup_by_key("User", ["email"], ["alice@example.com"])
if found:
    print(found.get("email"))

count_type¶

db.count_type(type_name: str) -> int

Count records of a specific type (polymorphic). Returns 0 if the type is missing.

drop¶

db.drop()

Drop the entire database (irreversible).

is_transaction_active¶

db.is_transaction_active() -> bool

Check if a transaction is currently active.

set_wal_flush¶

db.set_wal_flush(mode: str)

Configure WAL flush strategy. Modes: "no", "yes_nometadata", "yes_full".

set_read_your_writes¶

db.set_read_your_writes(enabled: bool)

Toggle read-your-writes consistency for the current connection.

set_auto_transaction¶

db.set_auto_transaction(enabled: bool)

Enable or disable automatic transaction management.

async_executor¶

db.async_executor() -> AsyncExecutor

Experimental: Not advised for production use yet. Prefer standard transactions and synchronous workflows.

export_database¶

db.export_database(
    file_path: str,
    format: str = "jsonl",
    overwrite: bool = False,
    include_types: Optional[List[str]] = None,
    exclude_types: Optional[List[str]] = None,
    verbose: int = 1,
) -> dict

Export the database to JSONL (backup/restore), GraphML, or GraphSON.

export_to_csv¶

db.export_to_csv(query: str, file_path: str, language: str = "sql", fieldnames: Optional[List[str]] = None)

Run a query and write results to CSV.

create_vector_index¶

db.create_vector_index(
    vertex_type: str,
    vector_property: str,
    dimensions: int,
    distance_function: str = "cosine",
    max_connections: int = 16,
    beam_width: int = 100,
    quantization: str = "INT8",
    location_cache_size: int | None = None,
    graph_build_cache_size: int | None = None,
    mutations_before_rebuild: int | None = None,
    store_vectors_in_graph: bool = False,
    add_hierarchy: bool | None = True,
    pq_subspaces: int | None = None,
    pq_clusters: int | None = None,
    pq_center_globally: bool | None = None,
    pq_training_limit: int | None = None,
    build_graph_now: bool = True,
) -> VectorIndex

Create a vector index for similarity search (JVector implementation). Existing records are indexed automatically when the index is created. By default, graph preparation is performed immediately (build_graph_now=True).

Parameters:

vertex_type (str): Vertex type containing vectors
vector_property (str): Property storing vector arrays
dimensions (int): Vector dimensionality
distance_function (str): "cosine", "euclidean", or "inner_product"
max_connections (int): Max connections per node (default: 16). Maps to maxConnections in HNSW (JVector).
beam_width (int): Beam width for search/construction (default: 100). Maps to beamWidth in HNSW (JVector).
quantization (str | None): "INT8" (recommended), "BINARY", "PRODUCT" for PQ, or None for full precision (default: "INT8"). Prefer "INT8" for current production usage in these bindings; "PRODUCT"/PQ is currently not recommended for production workloads.
location_cache_size (int | None): Override location cache size (default: None, uses engine default).
graph_build_cache_size (int | None): Override graph build cache size (default: None, uses engine default).
mutations_before_rebuild (int | None): Override rebuild threshold (default: None, uses engine default).
store_vectors_in_graph (bool): Persist vectors inline in graph file (faster reopen/search, larger graph).
add_hierarchy (bool | None): Force enabling/disabling HNSW hierarchy (default: True).
pq_subspaces (int | None): PQ subspaces (M). Requires quantization="PRODUCT".
pq_clusters (int | None): PQ clusters per subspace (K). Requires quantization="PRODUCT".
pq_center_globally (bool | None): PQ global centering flag. Requires quantization="PRODUCT".
pq_training_limit (int | None): PQ training sample cap. Requires quantization="PRODUCT".
build_graph_now (bool): If True (default), eagerly builds/loads the vector graph immediately after index creation. Set to False to defer graph preparation to first query.

Returns:

VectorIndex: Index object for similarity search

Example:

import numpy as np

# Create schema (auto-transactional)
db.command("sql", "CREATE VERTEX TYPE Document")
db.command("sql", "CREATE PROPERTY Document.embedding ARRAY_OF_FLOATS")
db.command("sql", "CREATE PROPERTY Document.id STRING")

# Create vector index
index = db.create_vector_index("Document", "embedding", dimensions=384)

# Add vectors
with db.transaction():
    for i, embedding in enumerate(embeddings):
        vertex = db.new_vertex("Document")
        vertex.set("id", f"doc_{i}")
        vertex.set("embedding", arcadedb.to_java_float_array(embedding))
        vertex.save()

# Search
query_vector = np.random.rand(384)
results = index.find_nearest(query_vector, k=5)

See Vector Search Guide for details.

close¶

db.close()

Close the database connection.

Example:

db = arcadedb.create_database("./mydb")
try:
    # Use database
    pass
finally:
    db.close()

Context Manager

Prefer using with statement for automatic cleanup

is_open¶

db.is_open() -> bool

Check if database connection is open.

Returns:

bool: True if database is open

get_name¶

db.get_name() -> str

Get the database name.

Returns:

str: Database name

get_database_path¶

db.get_database_path() -> str

Get the file system path to the database.

Returns:

str: Database path

DatabaseFactory Class¶

Factory for creating and opening databases with custom configuration.

Constructor¶

DatabaseFactory(path: str)

Parameters:

path (str): Database path

Example:

factory = arcadedb.DatabaseFactory("./mydb")
if factory.exists():
    db = factory.open()
else:
    db = factory.create()

create¶

factory.create() -> Database

Create a new database.

open¶

factory.open() -> Database

Open an existing database.

exists¶

factory.exists() -> bool

Check if database exists.

Context Manager Support¶

All database objects support context managers:

# Database
with arcadedb.create_database("./mydb") as db:
    # Automatic cleanup
    pass

# Transaction
with db.transaction():
    # Auto commit/rollback
    pass

Query Languages¶

SQL¶

ArcadeDB's extended SQL with graph and document support:

# Documents
db.query("sql", "SELECT FROM Person WHERE age > 25")

# Graph traversal
db.query("sql", "SELECT expand(out('Knows')) FROM Person WHERE name = 'Alice'")

# Aggregation
db.query("sql", "SELECT count(*) as total, avg(age) as avg_age FROM Person")

OpenCypher¶

OpenCypher graph query language:

db.query("opencypher", """
    MATCH (person:Person)-[:Knows]->(friend)
    WHERE person.age > 25
    RETURN friend.name, friend.age
""")

Best Practices¶

1. Use Context Managers¶

# ✅ Good - automatic cleanup
with arcadedb.create_database("./mydb") as db:
    pass

# ❌ Avoid - manual cleanup
db = arcadedb.create_database("./mydb")
db.close()

2. Always Use Transactions for Writes¶

# ✅ Good
with db.transaction():
    person = db.new_document("Person")
    person.set("name", "Alice").save()

# ❌ Will fail
db.command("sql", "INSERT INTO Person SET name = 'Alice'")

3. Use Parameterized Queries¶

# ✅ Good - safe from injection
name = user_input
db.query("sql", "SELECT FROM Person WHERE name = ?", name)

# ❌ Dangerous - SQL injection risk
db.query("sql", f"SELECT FROM Person WHERE name = '{user_input}'")

4. Check Database Existence¶

if arcadedb.database_exists("./mydb"):
    db = arcadedb.open_database("./mydb")
else:
    db = arcadedb.create_database("./mydb")

Database API Reference¶

Module Functions¶

create_database¶

open_database¶

database_exists¶

Database Class¶

Constructor¶

query¶

command¶

transaction¶

begin¶

commit¶

rollback¶

new_vertex¶

new_document¶

lookup_by_rid¶

lookup_by_key¶

count_type¶

drop¶

is_transaction_active¶

set_wal_flush¶

set_read_your_writes¶

set_auto_transaction¶

async_executor¶

export_database¶

export_to_csv¶

create_vector_index¶

close¶

is_open¶

get_name¶

get_database_path¶

DatabaseFactory Class¶

Constructor¶

create¶

open¶

exists¶

Context Manager Support¶

Query Languages¶

SQL¶

OpenCypher¶

Best Practices¶

1. Use Context Managers¶

2. Always Use Transactions for Writes¶

3. Use Parameterized Queries¶

4. Check Database Existence¶

See Also¶