This article explores the implementation of gradient descent algorithms for minimizing global loss functions in neural networks, particularly in problems governed by Rankine-Hugoniot conditions. While gradient descent reliably converges, scalability issues arise when handling large domains with many coupled networks. To address this, a domain decomposition method (DDM) is introduced, enabling parallel optimization of local loss functions. The result is faster convergence, improved scalability, and a more efficient framework for training complex AI models.This article explores the implementation of gradient descent algorithms for minimizing global loss functions in neural networks, particularly in problems governed by Rankine-Hugoniot conditions. While gradient descent reliably converges, scalability issues arise when handling large domains with many coupled networks. To address this, a domain decomposition method (DDM) is introduced, enabling parallel optimization of local loss functions. The result is faster convergence, improved scalability, and a more efficient framework for training complex AI models.

Why Gradient Descent Converges (and Sometimes Doesn’t) in Neural Networks

2025/09/19 18:38

Abstract and 1. Introduction

1.1. Introductory remarks

1.2. Basics of neural networks

1.3. About the entropy of direct PINN methods

1.4. Organization of the paper

  1. Non-diffusive neural network solver for one dimensional scalar HCLs

    2.1. One shock wave

    2.2. Arbitrary number of shock waves

    2.3. Shock wave generation

    2.4. Shock wave interaction

    2.5. Non-diffusive neural network solver for one dimensional systems of CLs

    2.6. Efficient initial wave decomposition

  2. Gradient descent algorithm and efficient implementation

    3.1. Classical gradient descent algorithm for HCLs

    3.2. Gradient descent and domain decomposition methods

  3. Numerics

    4.1. Practical implementations

    4.2. Basic tests and convergence for 1 and 2 shock wave problems

    4.3. Shock wave generation

    4.4. Shock-Shock interaction

    4.5. Entropy solution

    4.6. Domain decomposition

    4.7. Nonlinear systems

  4. Conclusion and References

3. Gradient descent algorithm and efficient implementation

In this section we discuss the implementation of gradient descent algorithms for solving the minimization problems (11), (20) and (35). We note that these problems involve a global loss functional measuring the residue of HCL in the whole domain, as well Rankine-Hugoniot conditions, which results in training of a number of neural networks. In all the tests we have done, the gradient descent method converges and provides accurate results. We note also, that in problems with a large number of DLs, the global loss functional couples a large number of networks and the gradient descent algorithm may converge slowly. For these problems we present a domain decomposition method (DDM).

3.1. Classical gradient descent algorithm for HCLs

All the problems (11), (20) and (35) being similar, we will demonstrate in details the algorithm for the problem (20). We assume that the solution is initially constituted by i) D ∈ {1, 2, . . . , } entropic shock waves emanating from x1, . . . , xD, ii) an arbitrary number of rarefaction waves, and that iii) there is no shock generation for t ∈ [0, T].

\

\

3.2. Gradient descent and domain decomposition methods

Rather than minimizing the global loss function (21) (or (12), (36)), we here propose to decouple the optimization of the neural networks, and make it scalable. The approach is closely connected to domain decomposition methods (DDMs) Schwarz Waveform Relaxation (SWR) methods [21, 22, 23]. The resulting algorithm allows for embarrassingly parallel computation of minimization of local loss functions.

\ \

\ \ \

\ \ \

\ \ In conclusion, the DDM becomes relevant thanks to its scalability and for kDDMkLocal < kGlobal, which is expected for D large.

\

:::info Authors:

(1) Emmanuel LORIN, School of Mathematics and Statistics, Carleton University, Ottawa, Canada, K1S 5B6 and Centre de Recherches Mathematiques, Universit´e de Montr´eal, Montreal, Canada, H3T 1J4 (elorin@math.carleton.ca);

(2) Arian NOVRUZI, a Corresponding Author from Department of Mathematics and Statistics, University of Ottawa, Ottawa, ON K1N 6N5, Canada (novruzi@uottawa.ca).

:::


:::info This paper is available on arxiv under CC by 4.0 Deed (Attribution 4.0 International) license.

:::

\

Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter service@support.mexc.com pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.
Partager des idées

Vous aimerez peut-être aussi

Grayscale GDLC kan multi-crypto ETF worden

Grayscale GDLC kan multi-crypto ETF worden

Connect met Like-minded Crypto Enthusiasts! Connect op Discord! Check onze Discord   De Amerikaanse Securities and Exchange Commission heeft groen licht gegeven voor de omzetting van het Grayscale Digital Large Cap Fund naar een exchange traded product op NYSE Arca. Daarmee wordt voor het eerst in de Verenigde Staten een multi crypto product officieel toegelaten tot een gereguleerde beurs. Deze beslissing is een nieuwe fase in de adoptie van crypto door de financiële sector. Van OTC naar gereguleerd beursproduct Tot nu toe werd de GDLC verhandeld als een OTC fonds wat vaak samen ging met beperkte toegang en structurele prijsafwijkingen van de onderliggende waarde. Met de conversie naar een ETP verdwijnt dit nadeel. Beleggers krijgen de mogelijkheid om intraday exposure te verkrijgen tot meerdere cryptocurrencies tegelijk. Volgens de laatste cijfers beheert het fonds meer dan $915 miljoen aan activa. Het product wordt opgebouwd uit vijf grote namen: Bitcoin, Ethereum, XRP, Solana en Cardano. Deze samenstelling zorgt voor een bredere spreiding van risico’s. Verspreiden binnen een product Het belangrijkste voordeel van een multi crypto ETF is de mogelijkheid tot directe diversificatie. Waar beleggers bij een Bitcoin ETF enkel afhankelijk zijn van de prijs van BTC, biedt GDLC in een product toegang tot meerdere top altcoins. Daarmee ontstaat een beter evenwicht tussen rendement en risico, vooral voor institutionele beleggers die op zoek zijn naar een gereguleerde manier om hun allocatie te verbreden. SEC zet stap richting duidelijker regelgeving De goedkeuring van de GDLC past binnen de nieuwe generic listing standards van de SEC. Deze standaarden zijn bedoeld om de beoordeling van crypto ETF’s te versnellen en voorspelbaarder te maken. In plaats van elk afzonderlijk dossier langdurig te analyseren, kunnen producten die aan basiscriteria voldoen sneller op de markt komen. Voor de sector is dit een signaal dat de toezichthouder zich beweegt van een handhavings gerichte aanpak naar een meer gestructureerd regelgevende aanpak. Institutionele partijen die eerder huiverig waren, zien hiermee de drempel verlaagd om toe te treden. Grayscale Digital Large Cap Fund $GDLC was just approved for trading along with the Generic Listing Standards. The Grayscale team is working expeditiously to bring the *FIRST* multi #crypto asset ETP to market with Bitcoin, Ethereum, XRP, Solana, and Cardano#BTC #ETH $XRP $SOL… — Peter Mintzberg (@PeterMintzberg) September 17, 2025 Impact op markt en instroom De timing van deze beslissing is verrassend. Bitcoin ETF’s hadden recent nog dagelijkse instromen van gemiddeld $290 miljoen, terwijl Ethereum producten juist uitstromen zagen. Een multi crypto product aantrekkelijk worden als alternatief dat beide assets en belangrijke altcoins combineert. Analisten wijzen erop dat als GDLC slechts vijf procent van de huidige instromen naar Bitcoin-ETF’s weet aan te trekken, dit al kan neerkomen op zo’n $15 miljoen per dag. Nieuwe routes voor institutionele allocatie Voor institutionele beleggers die diversificatie zoeken binnen de crypto markt zonder afhankelijk te zijn van ongecontroleerde exchanges, opent GDLC een gereguleerde en transparante route. Met een aankoop krijgen zij toegang tot meerdere leidende blockchains, waarbij de custody en naleving van regelgeving gewaarborgd zijn. De komst van dit product kan bovendien een domino effect veroorzaken. Er liggen momenteel nog tientallen aanvragen voor crypto ETF’s bij de SEC, variërend van stablecoin exposure tot altcoins als Avalanche en Litecoin. Best wallet - betrouwbare en anonieme wallet Best wallet - betrouwbare en anonieme wallet Meer dan 60 chains beschikbaar voor alle crypto Vroege toegang tot nieuwe projecten Hoge staking belongingen Lage transactiekosten Best wallet review Koop nu via Best Wallet Let op: cryptocurrency is een zeer volatiele en ongereguleerde investering. Doe je eigen onderzoek. Het bericht Grayscale GDLC kan multi-crypto ETF worden is geschreven door Timo Bruinsel en verscheen als eerst op Bitcoinmagazine.nl.
Partager
Coinstats2025/09/20 02:31
Partager