[ML] Inference request count telemetry per node #110947

jonathan-buttner · 2024-07-16T20:46:49Z

WIP

This PR wires up the telemetry code to record inference request counts by model id (if it is defined).

The inference section of the telemetry looks like this now:

"inference": {
        "available": true,
        "enabled": true,
        "models": [
            {
                "service": "cohere",
                "task_type": "RERANK",
                "count": 1
            },
            {
                "service": "cohere",
                "task_type": "TEXT_EMBEDDING",
                "count": 1
            },
            {
                "service": "openai",
                "task_type": "TEXT_EMBEDDING",
                "count": 1
            }
        ],
        "requests": [
            {
                "service": "cohere",
                "task_type": "rerank",
                "count": 1,
                "model_id": "rerank-english-v3.0"
            },
            {
                "service": "cohere",
                "task_type": "text_embedding",
                "count": 1,
                "model_id": "embed-english-v3.0"
            },
            {
                "service": "openai",
                "task_type": "text_embedding",
                "count": 1,
                "model_id": "text-embedding-3-small"
            }
        ]
    },

TODOs

Spinning up a cluster and testing that the apm metering works as expected
Making the changes in the telemetry repo to index the inference usage in a new index

…ence-request-telemetry-nodes

jonathan-buttner · 2024-07-17T20:58:10Z

@elasticmachine merge upstream

prwhelan · 2024-07-18T13:44:57Z

@elasticmachine update branch

elasticmachine · 2024-07-18T13:45:00Z

merge conflict between base and head

prwhelan · 2024-07-18T17:04:09Z

@elasticmachine update branch

prwhelan · 2024-07-22T20:37:27Z

Tested with APM:

{
  "_index": ".ds-metrics-apm.app.elasticsearch-default-2024.07.22-000001",
    ...
    "data_stream": {
      "dataset": "apm.app.elasticsearch",
      "namespace": "default",
      "type": "metrics"
    },
    "es": {
      "inference": {
        "requests": {
          "count": {
            "total": 8
          }
        }
      }
    },
    ...
    "labels": {
      "model_id": ".elser_model_2_linux-x86_64",
      "otel_instrumentation_scope_name": "elasticsearch",
      "service": "elser",
      "task_type": "sparse_embedding"
    },
    ...
  }
}

jonathan-buttner added 3 commits July 16, 2024 13:52

Stats being returned

e8a9d4d

Adding bwc tests

3891d7a

Adding tests for inference request count usage

d33fa86

jonathan-buttner added >non-issue :ml Machine learning Team:ML Meta label for the ML team v8.16.0 labels Jul 16, 2024

Removing commented code

332a1f2

jonathan-buttner added the cloud-deploy Publish cloud docker image for Cloud-First-Testing label Jul 16, 2024

jonathan-buttner added 2 commits July 16, 2024 16:53

Merge branch 'main' of github.com:elastic/elasticsearch into ml-infer…

d197d90

…ence-request-telemetry-nodes

Fixing issue with null value in map

adff744

Merge branch 'main' into ml-inference-request-telemetry-nodes

c776883

Merge branch 'main' into ml-inference-request-telemetry-nodes

0db9238

elasticmachine and others added 2 commits July 19, 2024 03:04

Merge branch 'main' into ml-inference-request-telemetry-nodes

d8e85de

Update usage to include requests

4a741fe

mark-vieira added v9.0.0 and removed v8.16.0 labels Sep 11, 2024

elasticsearchmachine added v9.1.0 and removed v9.0.0 labels Jan 30, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[ML] Inference request count telemetry per node #110947

[ML] Inference request count telemetry per node #110947

Uh oh!

jonathan-buttner commented Jul 16, 2024 •

edited

Loading

Uh oh!

jonathan-buttner commented Jul 17, 2024

Uh oh!

prwhelan commented Jul 18, 2024

Uh oh!

elasticmachine commented Jul 18, 2024

Uh oh!

prwhelan commented Jul 18, 2024

Uh oh!

prwhelan commented Jul 22, 2024

Uh oh!

Uh oh!

[ML] Inference request count telemetry per node #110947

Are you sure you want to change the base?

[ML] Inference request count telemetry per node #110947

Uh oh!

Conversation

jonathan-buttner commented Jul 16, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

TODOs

Uh oh!

jonathan-buttner commented Jul 17, 2024

Uh oh!

prwhelan commented Jul 18, 2024

Uh oh!

elasticmachine commented Jul 18, 2024

Uh oh!

prwhelan commented Jul 18, 2024

Uh oh!

prwhelan commented Jul 22, 2024

Uh oh!

Uh oh!

jonathan-buttner commented Jul 16, 2024 •

edited

Loading