Elasticsearch => Interfaccia Python

Parametri

Parametro	Dettagli
padroni di casa	Matrice di host sotto forma di oggetto contenente chiavi `host` e `port` . L' `host` predefinito è 'localhost' e la `port` è 9200. Una voce di esempio assomiglia a `[{"host": "ip of es server", "port": 9200}]`
sniff_on_start	Booleano se si desidera che il client annodi i nodi all'avvio, sniffing significa ottenere l'elenco dei nodi nel cluster elasticsearch
sniff_on_connection_fail	Booleano per l'attivazione dello sniffing se la connessione non riesce quando il client è attivo
sniffer_timeout	differenza di tempo in secondi tra ogni annusata
sniff_timeout	tempo per una singola richiesta di sniffing in pochi secondi
retry_on_timeout	Booelan per se il client dovrebbe timeout innescare contattando un diverso nodo elasticsearch o semplicemente lanciare un errore
http_auth	L'autenticazione http di base può essere fornita qui sotto forma di `username:password`

Indicizzazione di un documento (ad es. Aggiunta di un campione)

Installa la libreria Python necessaria tramite:

$ pip install elasticsearch

Collegati a Elasticsearch, crea un documento (ad es. Inserimento dati) e "indicizza" il documento utilizzando Elasticsearch.

from datetime import datetime
from elasticsearch import Elasticsearch

# Connect to Elasticsearch using default options (localhost:9200)
es = Elasticsearch()

# Define a simple Dictionary object that we'll index to make a document in ES
doc = {
    'author': 'kimchy',
    'text': 'Elasticsearch: cool. bonsai cool.',
    'timestamp': datetime.now(),
}

# Write a document
res = es.index(index="test-index", doc_type='tweet', id=1, body=doc)
print(res['created'])

# Fetch the document
res = es.get(index="test-index", doc_type='tweet', id=1)
print(res['_source'])

# Refresh the specified index (or indices) to guarantee that the document
#  is searchable (avoid race conditions with near realtime search)
es.indices.refresh(index="test-index")

# Search for the document
res = es.search(index="test-index", body={"query": {"match_all": {}}})
print("Got %d Hits:" % res['hits']['total'])

# Show each "hit" or search response (max of 10 by default)
for hit in res['hits']['hits']:
    print("%(timestamp)s %(author)s: %(text)s" % hit["_source"])

Connessione a un cluster

es = Elasticsearch(hosts=hosts, sniff_on_start=True, sniff_on_connection_fail=True, sniffer_timeout=60, sniff_timeout=10, retry_on_timeout=True)

Creazione di un indice vuoto e impostazione della mappatura

In questo esempio, creiamo un indice vuoto (non indichiamo alcun documento in esso) definendone la mappatura.

Per prima cosa, creiamo un'istanza di ElasticSearch e quindi definiamo la mappatura della nostra scelta. Successivamente, controlliamo se l'indice esiste e, in caso contrario, lo creiamo specificando i parametri index e del body che contengono rispettivamente il nome dell'indice e il corpo della mappatura.

from elasticsearch import Elasticsearch

# create an ElasticSearch instance
es = Elasticsearch()
# name the index
index_name = "my_index"
# define the mapping
mapping = {
    "mappings": {
        "my_type": {
                "properties": {
                    "foo": {'type': 'text'},
                    "bar": {'type': 'keyword'}
                }
            }
        }
    }
    
# create an empty index with the defined mapping - no documents added
if not es.indices.exists(index_name):
    res = es.indices.create(
        index=index_name,
        body=mapping
    )
    # check the response of the request
    print(res)
    # check the result of the mapping on the index
    print(es.indices.get_mapping(index_name))

Aggiornamento e aggiornamento parziale tramite query

Aggiornamento parziale: utilizzato quando è necessario un aggiornamento parziale del documento, ovvero nell'esempio seguente il name del campo del documento con id doc_id verrà aggiornato in "John". Notare che se il campo è mancante, verrà semplicemente aggiunto al documento.

doc = {
    "doc": {
        "name": "John"
    }
}
es.update(index='index_name',
          doc_type='doc_name',
          id='doc_id',
          body=doc)

Aggiorna per query: utilizzata quando è necessario aggiornare i documenti che soddisfano una condizione, ovvero nell'esempio seguente viene aggiornata l'età dei documenti il cui campo del name corrisponde a "Giovanni".

q = {
  "script": {
    "inline": "ctx._source.age=23",
    "lang": "painless"
  },
  "query": {
    "match": {
        "name": "John"
    }
  }
}

es.update_by_query(body=q, 
                   doc_type='doc_name', 
                   index='index_name')

Modified text is an extract of the original Stack Overflow Documentation

Autorizzato sotto CC BY-SA 3.0

Non affiliato con Stack Overflow

Elasticsearch
Interfaccia Python

Ricerca…

Parametri

Indicizzazione di un documento (ad es. Aggiunta di un campione)

Connessione a un cluster

Creazione di un indice vuoto e impostazione della mappatura

Aggiornamento e aggiornamento parziale tramite query