Ratio has zero denominator #40

Open
opened 2023-03-31 12:56:49 +02:00 by savau · 12 comments
savau commented 2023-03-31 12:56:49 +02:00 (Migrated from gitlab.uniworx.de)

Seit Produktivschaltung 27.1.2/4, inklusive Aufteilung auf Webserver/Jobworker schlägt Livness-Prüfung mit /health regelmäßig fehl mit 500:

2023-03-31 08:25:54 +0000 [Error#yesod] Exception from Warp: Ratio has zero denominator @(uniworx-27.1.4-82fNbj8unOsJw6Jf6V1W28:Application src/Application.hs:567:15)
2023-03-31 08:26:18 +0000 [Error#yesod-core] Error handler errored out: InternalError "Ratio has zero denominator" @(yesod-core-1.6.20.2-7VqWGURyzmdJ8HRF4U5pfA:Yesod.Core.Internal.Run src/Yesod/Core/Internal/Run.hs:210:21)

Änderung der Health-Check-Settings (vorher undefiniert) auf:

  jobworker: 

    database.yaml: | 

      database: 

        user: fd2022pdbyp@aps-fradrive-postgresql.postgres.database.azure.com 

        host: aps-fradrive-postgresql.postgres.database.azure.com 

        database: prod 

        pool-size: 10 

    jobworker.yaml: | 

      job-mode: 

        tag: local 

        accept-offload: true 

      job-workers: 8 

      check-missing-files: null 

      notification-expiration: 7200 

      max-flush: 10 

      health-check-interval: 

        matching-cluster-config: 300 

        http-reachable:          300 

        ldap-admins:             600 

        smtp-connect:            1200 

        widget-memcached:        300 

        active-job-executors:    300 

        does-flush:              60 

  webserver: 

    database.yaml: | 

      database: 

        user: fd2022pdbyp@aps-fradrive-postgresql.postgres.database.azure.com 

        host: aps-fradrive-postgresql.postgres.database.azure.com 

        database: prod 

        pool-size: 100 

    webserver.yaml: | 

      job-mode: 

        tag: offload 

      job-workers: 2 

      job-flush-interval: 10 

      check-missing-files: 57600 

      health-check-interval: 

        matching-cluster-config: 300 

        http-reachable:          300 

        ldap-admins:             600 

        smtp-connect:            0 

        widget-memcached:        300 

        active-job-executors:    300 

        does-flush:              0 
Seit Produktivschaltung 27.1.2/4, inklusive Aufteilung auf Webserver/Jobworker schlägt Livness-Prüfung mit /health regelmäßig fehl mit 500: ``` 2023-03-31 08:25:54 +0000 [Error#yesod] Exception from Warp: Ratio has zero denominator @(uniworx-27.1.4-82fNbj8unOsJw6Jf6V1W28:Application src/Application.hs:567:15) 2023-03-31 08:26:18 +0000 [Error#yesod-core] Error handler errored out: InternalError "Ratio has zero denominator" @(yesod-core-1.6.20.2-7VqWGURyzmdJ8HRF4U5pfA:Yesod.Core.Internal.Run src/Yesod/Core/Internal/Run.hs:210:21) ``` Änderung der Health-Check-Settings (vorher undefiniert) auf: ```   jobworker:     database.yaml: |       database:         user: fd2022pdbyp@aps-fradrive-postgresql.postgres.database.azure.com         host: aps-fradrive-postgresql.postgres.database.azure.com         database: prod         pool-size: 10     jobworker.yaml: |       job-mode:         tag: local         accept-offload: true       job-workers: 8       check-missing-files: null       notification-expiration: 7200       max-flush: 10       health-check-interval:         matching-cluster-config: 300         http-reachable:          300         ldap-admins:             600         smtp-connect:            1200         widget-memcached:        300         active-job-executors:    300         does-flush:              60   webserver:     database.yaml: |       database:         user: fd2022pdbyp@aps-fradrive-postgresql.postgres.database.azure.com         host: aps-fradrive-postgresql.postgres.database.azure.com         database: prod         pool-size: 100     webserver.yaml: |       job-mode:         tag: offload       job-workers: 2       job-flush-interval: 10       check-missing-files: 57600       health-check-interval:         matching-cluster-config: 300         http-reachable:          300         ldap-admins:             600         smtp-connect:            0         widget-memcached:        300         active-job-executors:    300         does-flush:              0 ```
savau commented 2023-04-05 10:50:22 +02:00 (Migrated from gitlab.uniworx.de)

Stack trace benutzen?
Verlangsamt das komplette Programm, könnte den Fehler aber finden?

By Steffen Jost on 2023-04-05T10:50:22 (imported from GitLab)

Stack trace benutzen? Verlangsamt das komplette Programm, könnte den Fehler aber finden? *By Steffen Jost on 2023-04-05T10:50:22 (imported from GitLab)*
jost commented 2023-05-10 17:22:39 +02:00 (Migrated from gitlab.uniworx.de)

Aktuelle Entwicklung: Der Error Handler benutzt jetzt kein siteLayout mehr, da der Fehler dabei erneut geworfen wurde. Seitdem wurde der Fehler aber noch nicht wieder beobachtet.

Gibt es eine Verbindung zu #47 ?

_Aktuelle Entwicklung:_ Der Error Handler benutzt jetzt kein `siteLayout` mehr, da der Fehler dabei erneut geworfen wurde. Seitdem wurde der Fehler aber noch nicht wieder beobachtet. Gibt es eine Verbindung zu #47 ?
jost commented 2023-05-10 17:37:08 +02:00 (Migrated from gitlab.uniworx.de)

assigned to @savau

assigned to @savau
jost commented 2023-05-10 17:38:50 +02:00 (Migrated from gitlab.uniworx.de)

Der Fehler tritt auch ohne SiteLayout noch auf: man erhalt einfach eine weiße Seite mit dem Text "Ratio has zero denominator" 😞

@savau Bitte diskutiere mal mit @kleen was wir jetzt noch tun können!

Der Fehler tritt auch ohne SiteLayout noch auf: man erhalt einfach eine weiße Seite mit dem Text "Ratio has zero denominator" :disappointed: @savau Bitte diskutiere mal mit @kleen was wir jetzt noch tun können!
jost commented 2023-05-10 18:00:17 +02:00 (Migrated from gitlab.uniworx.de)

Die Fehlermeldung im Log lautet:

2023-05-10 15:58:48 +0000 [Error#yesod] Exception from Warp: Ratio has zero denominator @(uniworx-27.4.2-CvnxmUbM1JOB4rn66MFF0s:Application src/Application.hs:567:15)
Die Fehlermeldung im Log lautet: ``` 2023-05-10 15:58:48 +0000 [Error#yesod] Exception from Warp: Ratio has zero denominator @(uniworx-27.4.2-CvnxmUbM1JOB4rn66MFF0s:Application src/Application.hs:567:15) ```
jost commented 2023-06-06 11:57:23 +02:00 (Migrated from gitlab.uniworx.de)

Zwischen 3.6. und 5.6 hatten wir wieder viele Abstürze. Die Schnittstelle zum Abfragen und Hochladen der CSV Dateien zum/from E-Learning funktionierte praktisch gar nicht, siehe Bild.

Fehlermeldungen;

  • HTTP request failed: HTTP/1.1 500 Internal Server Error
  • HTTP request failed: HTTP/1.1 503 Service Temporarily Unavailable (öfters, 2. Versuch dann meist erfolgreich)
  • HTTP request failed: HTTP/1.1 400 Bad Request (heute Morgen einmal aufgetreten; der zweite Übertragungsversuch eine Minute später erfolgreich)

image

Zwischen 3.6. und 5.6 hatten wir wieder viele Abstürze. Die Schnittstelle zum Abfragen und Hochladen der CSV Dateien zum/from E-Learning funktionierte praktisch gar nicht, siehe Bild. Fehlermeldungen; - HTTP request failed: HTTP/1.1 500 Internal Server Error - HTTP request failed: HTTP/1.1 503 Service Temporarily Unavailable (öfters, 2. Versuch dann meist erfolgreich) - HTTP request failed: HTTP/1.1 400 Bad Request _(heute Morgen einmal aufgetreten; der zweite Übertragungsversuch eine Minute später erfolgreich)_ ![image](/uploads/8646ee814907ea5b3b6584ba568914cb/image.png)
jost commented 2023-06-06 11:57:41 +02:00 (Migrated from gitlab.uniworx.de)

mentioned in issue #2

mentioned in issue #2
savau commented 2023-09-04 02:21:20 +02:00 (Migrated from gitlab.uniworx.de)

annotated-exceptions wäre vllt. auch einen Versuch wert

[`annotated-exceptions`](https://hackage.haskell.org/package/annotated-exception) wäre vllt. auch einen Versuch wert
jost commented 2023-09-04 08:50:10 +02:00 (Migrated from gitlab.uniworx.de)

Dann müsste man halt Checkpoints einbauen und hoffen, dass man mit so einer Art binärer Suche immer näher an die Aufrufstelle in unserem Code herankommt. Aber wie verteilt man die Checkpoints am besten?

Nicht ideal, aber besser als gar nicht weiterkommen.

Dann müsste man halt Checkpoints einbauen und hoffen, dass man mit so einer Art binärer Suche immer näher an die Aufrufstelle in unserem Code herankommt. Aber wie verteilt man die Checkpoints am besten? Nicht ideal, aber besser als gar nicht weiterkommen.
jost commented 2023-09-04 08:50:30 +02:00 (Migrated from gitlab.uniworx.de)

Das Update halte ich aber nach wie vor für wichtiger.

Das Update halte ich aber nach wie vor für wichtiger.
jost commented 2023-12-13 16:25:26 +01:00 (Migrated from gitlab.uniworx.de)

mentioned in commit ce45d26a21

mentioned in commit ce45d26a21a2a6cce505c43892af6cd90f21fb5a
jost commented 2024-03-04 16:17:04 +01:00 (Migrated from gitlab.uniworx.de)

mentioned in issue #144

mentioned in issue #144
This repo is archived. You cannot comment on issues.
No Milestone
No project
No Assignees
1 Participants
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: fraport/fradrive-old#40
No description provided.