#include "dynamics_gpu.h"
#include <iostream>

#define GPU_1D_KERNEL_LOOP(i, n) \
  for (size_t i = blockIdx.x * blockDim.x + threadIdx.x; i < n; i += blockDim.x * gridDim.x)

#define NUM_THREADS 256
#define NUM_BLOCKS(batch_size) ((batch_size + NUM_THREADS - 1) / NUM_THREADS)

#define casadi_sq(x) (x * x)

// Cleaner wrapper for the generated dynamics
__device__ void _dynamics_gpu(const double *q_in, const double *qdot_in, const double *tau_in, const double *h_in,
                              double *q_out, double *qdot_out)
{
  const double *arg[4] = {q_in, qdot_in, tau_in, h_in};
  double *res[2] = {q_out, qdot_out};

  double a0, a1, a10, a11, a12, a13, a14, a15, a16, a17, a18, a19, a2, a20, a21, a22, a23, a24, a25, a26, a27, a28, a3, a4, a5, a6, a7, a8, a9;
  a0=arg[0]? arg[0][0] : 0;
  a1=arg[3]? arg[3][0] : 0;
  a2=arg[1]? arg[1][0] : 0;
  a3=2.;
  a4=(a1/a3);
  a5=arg[2]? arg[2][0] : 0;
  a6=arg[0]? arg[0][1] : 0;
  a7=cos(a6);
  a8=arg[1]? arg[1][1] : 0;
  a9=2.0000000000000001e-01;
  a10=sin(a6);
  a11=(a10*a2);
  a12=(a9*a11);
  a12=(a8*a12);
  a13=-2.;
  a14=arg[2]? arg[2][1] : 0;
  a15=5.0000000000000000e-01;
  a16=(a15*a8);
  a16=(a9*a16);
  a17=(a11*a16);
  a17=(a14+a17);
  a18=(a13*a17);
  a12=(a12+a18);
  a12=(a7*a12);
  a18=(a7*a2);
  a19=(a9*a18);
  a19=(a19-a16);
  a19=(a8*a19);
  a18=(a8*a18);
  a18=(a9*a18);
  a19=(a19-a18);
  a19=(a10*a19);
  a12=(a12-a19);
  a12=(a5-a12);
  a19=(a9*a10);
  a19=(a19*a10);
  a19=(a15+a19);
  a12=(a12/a19);
  a18=9.8100000000000005e+00;
  a16=(a9*a7);
  a16=(a16*a10);
  a16=(a16/a19);
  a16=(a18*a16);
  a12=(a12+a16);
  a16=(a4*a12);
  a16=(a2+a16);
  a16=(a3*a16);
  a16=(a2+a16);
  a19=(a1/a3);
  a20=(a1/a3);
  a20=(a20*a8);
  a20=(a6+a20);
  a21=cos(a20);
  a22=(a1/a3);
  a23=20.;
  a17=(a23*a17);
  a7=(a7*a12);
  a10=(a18*a10);
  a7=(a7+a10);
  a11=(a8*a11);
  a7=(a7-a11);
  a7=(a13*a7);
  a17=(a17-a7);
  a7=(a22*a17);
  a7=(a8+a7);
  a20=sin(a20);
  a22=(a22*a12);
  a22=(a2+a22);
  a11=(a20*a22);
  a10=(a9*a11);
  a10=(a7*a10);
  a24=(a15*a7);
  a24=(a9*a24);
  a25=(a11*a24);
  a25=(a14+a25);
  a26=(a13*a25);
  a10=(a10+a26);
  a10=(a21*a10);
  a22=(a21*a22);
  a26=(a9*a22);
  a26=(a26-a24);
  a26=(a7*a26);
  a22=(a7*a22);
  a22=(a9*a22);
  a26=(a26-a22);
  a26=(a20*a26);
  a10=(a10-a26);
  a10=(a5-a10);
  a26=(a9*a20);
  a26=(a26*a20);
  a26=(a15+a26);
  a10=(a10/a26);
  a22=(a9*a21);
  a22=(a22*a20);
  a22=(a22/a26);
  a22=(a18*a22);
  a10=(a10+a22);
  a22=(a19*a10);
  a22=(a2+a22);
  a22=(a3*a22);
  a16=(a16+a22);
  a22=(a1/a3);
  a26=(a4*a17);
  a26=(a8+a26);
  a22=(a22*a26);
  a22=(a6+a22);
  a26=cos(a22);
  a24=(a1/a3);
  a25=(a23*a25);
  a21=(a21*a10);
  a20=(a18*a20);
  a21=(a21+a20);
  a7=(a7*a11);
  a21=(a21-a7);
  a21=(a13*a21);
  a25=(a25-a21);
  a21=(a24*a25);
  a21=(a8+a21);
  a22=sin(a22);
  a24=(a24*a10);
  a24=(a2+a24);
  a7=(a22*a24);
  a11=(a9*a7);
  a11=(a21*a11);
  a20=(a15*a21);
  a20=(a9*a20);
  a27=(a7*a20);
  a27=(a14+a27);
  a28=(a13*a27);
  a11=(a11+a28);
  a11=(a26*a11);
  a24=(a26*a24);
  a28=(a9*a24);
  a28=(a28-a20);
  a28=(a21*a28);
  a24=(a21*a24);
  a24=(a9*a24);
  a28=(a28-a24);
  a28=(a22*a28);
  a11=(a11-a28);
  a11=(a5-a11);
  a28=(a9*a22);
  a28=(a28*a22);
  a28=(a15+a28);
  a11=(a11/a28);
  a24=(a9*a26);
  a24=(a24*a22);
  a24=(a24/a28);
  a24=(a18*a24);
  a11=(a11+a24);
  a24=(a1*a11);
  a24=(a2+a24);
  a16=(a16+a24);
  a24=6.;
  a16=(a16/a24);
  a16=(a1*a16);
  a0=(a0+a16);
  if (res[0]!=0) res[0][0]=a0;
  a4=(a4*a17);
  a4=(a8+a4);
  a4=(a3*a4);
  a4=(a8+a4);
  a0=(a19*a25);
  a0=(a8+a0);
  a0=(a3*a0);
  a4=(a4+a0);
  a27=(a23*a27);
  a26=(a26*a11);
  a22=(a18*a22);
  a26=(a26+a22);
  a21=(a21*a7);
  a26=(a26-a21);
  a26=(a13*a26);
  a27=(a27-a26);
  a26=(a1*a27);
  a26=(a8+a26);
  a4=(a4+a26);
  a4=(a4/a24);
  a4=(a1*a4);
  a4=(a6+a4);
  if (res[0]!=0) res[0][1]=a4;
  a10=(a3*a10);
  a12=(a12+a10);
  a10=(a3*a11);
  a12=(a12+a10);
  a19=(a19*a25);
  a19=(a8+a19);
  a19=(a1*a19);
  a6=(a6+a19);
  a19=cos(a6);
  a10=(a1*a27);
  a10=(a8+a10);
  a6=sin(a6);
  a11=(a1*a11);
  a11=(a2+a11);
  a4=(a6*a11);
  a26=(a9*a4);
  a26=(a10*a26);
  a21=(a15*a10);
  a21=(a9*a21);
  a7=(a4*a21);
  a14=(a14+a7);
  a7=(a13*a14);
  a26=(a26+a7);
  a26=(a19*a26);
  a11=(a19*a11);
  a7=(a9*a11);
  a7=(a7-a21);
  a7=(a10*a7);
  a11=(a10*a11);
  a11=(a9*a11);
  a7=(a7-a11);
  a7=(a6*a7);
  a26=(a26-a7);
  a5=(a5-a26);
  a26=(a9*a6);
  a26=(a26*a6);
  a15=(a15+a26);
  a5=(a5/a15);
  a9=(a9*a19);
  a9=(a9*a6);
  a9=(a9/a15);
  a9=(a18*a9);
  a5=(a5+a9);
  a12=(a12+a5);
  a12=(a12/a24);
  a12=(a1*a12);
  a2=(a2+a12);
  if (res[1]!=0) res[1][0]=a2;
  a25=(a3*a25);
  a17=(a17+a25);
  a3=(a3*a27);
  a17=(a17+a3);
  a23=(a23*a14);
  a19=(a19*a5);
  a18=(a18*a6);
  a19=(a19+a18);
  a10=(a10*a4);
  a19=(a19-a10);
  a13=(a13*a19);
  a23=(a23-a13);
  a17=(a17+a23);
  a17=(a17/a24);
  a1=(a1*a17);
  a8=(a8+a1);
  if (res[1]!=0) res[1][1]=a8;
}

__device__ void _derivatives_gpu(const double *q_in, const double *qdot_in, const double *tau_in, const double *h_in,
                                 double *q_jac_qout, double *q_jac_qdotout, double *q_jac_uout,
                                 double *qdot_jac_qout, double *qdot_jac_qdotout, double *qdot_jac_tauout)
{
  const double *arg[4] = {q_in, qdot_in, tau_in, h_in};
  double *res[6] = {q_jac_qout, q_jac_qdotout, q_jac_uout, qdot_jac_qout, qdot_jac_qdotout, qdot_jac_tauout};

  double a0, a1, a10, a100, a101, a102, a11, a12, a13, a14, a15, a16, a17, a18, a19, a2, a20, a21, a22, a23, a24, a25, a26, a27, a28, a29, a3, a30, a31, a32, a33, a34, a35, a36, a37, a38, a39, a4, a40, a41, a42, a43, a44, a45, a46, a47, a48, a49, a5, a50, a51, a52, a53, a54, a55, a56, a57, a58, a59, a6, a60, a61, a62, a63, a64, a65, a66, a67, a68, a69, a7, a70, a71, a72, a73, a74, a75, a76, a77, a78, a79, a8, a80, a81, a82, a83, a84, a85, a86, a87, a88, a89, a9, a90, a91, a92, a93, a94, a95, a96, a97, a98, a99;
  a0=1.;
  if (res[0]!=0) res[0][0]=a0;
  a1=0.;
  if (res[0]!=0) res[0][1]=a1;
  a2=arg[3]? arg[3][0] : 0;
  a3=1.6666666666666666e-01;
  a4=2.;
  a5=(a2/a4);
  a6=9.8100000000000005e+00;
  a7=2.0000000000000001e-01;
  a8=arg[0]? arg[0][1] : 0;
  a9=cos(a8);
  a10=(a7*a9);
  a11=cos(a8);
  a12=(a10*a11);
  a13=sin(a8);
  a14=sin(a8);
  a15=(a7*a14);
  a15=(a13*a15);
  a12=(a12-a15);
  a15=5.0000000000000000e-01;
  a16=(a7*a13);
  a17=(a16*a13);
  a17=(a15+a17);
  a12=(a12/a17);
  a18=(a10*a13);
  a18=(a18/a17);
  a19=(a18/a17);
  a20=(a7*a11);
  a20=(a13*a20);
  a21=(a16*a11);
  a20=(a20+a21);
  a19=(a19*a20);
  a12=(a12-a19);
  a12=(a6*a12);
  a19=arg[1]? arg[1][1] : 0;
  a21=arg[1]? arg[1][0] : 0;
  a22=(a21*a11);
  a23=(a7*a22);
  a23=(a19*a23);
  a24=-2.;
  a25=(a15*a19);
  a25=(a7*a25);
  a26=(a25*a22);
  a27=(a24*a26);
  a23=(a23+a27);
  a23=(a9*a23);
  a27=(a13*a21);
  a28=(a7*a27);
  a29=(a19*a28);
  a30=arg[2]? arg[2][1] : 0;
  a31=(a27*a25);
  a31=(a30+a31);
  a32=(a24*a31);
  a29=(a29+a32);
  a32=(a29*a14);
  a23=(a23-a32);
  a32=(a9*a21);
  a33=(a7*a32);
  a33=(a33-a25);
  a34=(a19*a33);
  a35=(a19*a32);
  a35=(a7*a35);
  a34=(a34-a35);
  a35=(a34*a11);
  a36=(a21*a14);
  a37=(a19*a36);
  a37=(a7*a37);
  a36=(a7*a36);
  a36=(a19*a36);
  a37=(a37-a36);
  a37=(a13*a37);
  a35=(a35+a37);
  a23=(a23-a35);
  a23=(a23/a17);
  a35=arg[2]? arg[2][0] : 0;
  a37=(a9*a29);
  a36=(a13*a34);
  a37=(a37-a36);
  a37=(a35-a37);
  a37=(a37/a17);
  a36=(a37/a17);
  a36=(a36*a20);
  a23=(a23+a36);
  a12=(a12-a23);
  a23=(a5*a12);
  a23=(a4*a23);
  a36=(a2/a4);
  a20=(a2/a4);
  a38=(a20*a19);
  a38=(a8+a38);
  a39=cos(a38);
  a40=(a7*a39);
  a41=cos(a38);
  a42=(a40*a41);
  a43=sin(a38);
  a44=sin(a38);
  a45=(a7*a44);
  a45=(a43*a45);
  a42=(a42-a45);
  a45=(a7*a43);
  a46=(a45*a43);
  a46=(a15+a46);
  a42=(a42/a46);
  a47=(a40*a43);
  a47=(a47/a46);
  a48=(a47/a46);
  a49=(a7*a41);
  a49=(a43*a49);
  a50=(a45*a41);
  a49=(a49+a50);
  a48=(a48*a49);
  a42=(a42-a48);
  a42=(a6*a42);
  a48=(a2/a4);
  a50=(a6*a18);
  a50=(a37+a50);
  a51=(a48*a50);
  a51=(a21+a51);
  a52=(a43*a51);
  a53=(a7*a52);
  a54=20.;
  a26=(a54*a26);
  a55=(a9*a12);
  a14=(a50*a14);
  a55=(a55-a14);
  a11=(a6*a11);
  a55=(a55+a11);
  a22=(a19*a22);
  a55=(a55-a22);
  a55=(a24*a55);
  a26=(a26-a55);
  a55=(a48*a26);
  a22=(a53*a55);
  a31=(a54*a31);
  a11=(a9*a50);
  a14=(a6*a13);
  a11=(a11+a14);
  a14=(a19*a27);
  a11=(a11-a14);
  a11=(a24*a11);
  a31=(a31-a11);
  a11=(a48*a31);
  a11=(a19+a11);
  a14=(a51*a41);
  a12=(a48*a12);
  a56=(a43*a12);
  a14=(a14+a56);
  a56=(a7*a14);
  a56=(a11*a56);
  a22=(a22+a56);
  a56=(a15*a11);
  a56=(a7*a56);
  a57=(a56*a14);
  a58=(a15*a55);
  a58=(a7*a58);
  a59=(a52*a58);
  a57=(a57+a59);
  a59=(a24*a57);
  a22=(a22+a59);
  a22=(a39*a22);
  a59=(a11*a53);
  a60=(a52*a56);
  a60=(a30+a60);
  a61=(a24*a60);
  a59=(a59+a61);
  a61=(a59*a44);
  a22=(a22-a61);
  a61=(a39*a51);
  a62=(a7*a61);
  a62=(a62-a56);
  a63=(a11*a62);
  a64=(a11*a61);
  a64=(a7*a64);
  a63=(a63-a64);
  a64=(a63*a41);
  a65=(a62*a55);
  a12=(a39*a12);
  a66=(a51*a44);
  a12=(a12-a66);
  a66=(a7*a12);
  a66=(a66-a58);
  a66=(a11*a66);
  a65=(a65+a66);
  a66=(a61*a55);
  a12=(a11*a12);
  a66=(a66+a12);
  a66=(a7*a66);
  a65=(a65-a66);
  a65=(a43*a65);
  a64=(a64+a65);
  a22=(a22-a64);
  a22=(a22/a46);
  a64=(a39*a59);
  a65=(a43*a63);
  a64=(a64-a65);
  a64=(a35-a64);
  a64=(a64/a46);
  a65=(a64/a46);
  a65=(a65*a49);
  a22=(a22+a65);
  a42=(a42-a22);
  a22=(a36*a42);
  a22=(a4*a22);
  a23=(a23+a22);
  a22=(a2/a4);
  a31=(a5*a31);
  a31=(a19+a31);
  a31=(a22*a31);
  a31=(a8+a31);
  a65=cos(a31);
  a49=(a7*a65);
  a66=cos(a31);
  a12=(a5*a26);
  a12=(a22*a12);
  a12=(a0+a12);
  a66=(a66*a12);
  a58=(a49*a66);
  a67=sin(a31);
  a68=sin(a31);
  a68=(a68*a12);
  a12=(a7*a68);
  a12=(a67*a12);
  a58=(a58-a12);
  a12=(a7*a67);
  a69=(a12*a67);
  a69=(a15+a69);
  a58=(a58/a69);
  a70=(a49*a67);
  a70=(a70/a69);
  a71=(a70/a69);
  a72=(a7*a66);
  a72=(a67*a72);
  a73=(a12*a66);
  a72=(a72+a73);
  a71=(a71*a72);
  a58=(a58-a71);
  a58=(a6*a58);
  a71=(a2/a4);
  a73=(a6*a47);
  a73=(a64+a73);
  a74=(a71*a73);
  a74=(a21+a74);
  a75=(a67*a74);
  a76=(a7*a75);
  a57=(a54*a57);
  a77=(a39*a42);
  a44=(a73*a44);
  a77=(a77-a44);
  a41=(a6*a41);
  a77=(a77+a41);
  a55=(a52*a55);
  a14=(a11*a14);
  a55=(a55+a14);
  a77=(a77-a55);
  a77=(a24*a77);
  a57=(a57-a77);
  a77=(a71*a57);
  a55=(a76*a77);
  a60=(a54*a60);
  a14=(a39*a73);
  a41=(a6*a43);
  a14=(a14+a41);
  a41=(a11*a52);
  a14=(a14-a41);
  a14=(a24*a14);
  a60=(a60-a14);
  a14=(a71*a60);
  a14=(a19+a14);
  a41=(a74*a66);
  a42=(a71*a42);
  a44=(a67*a42);
  a41=(a41+a44);
  a44=(a7*a41);
  a44=(a14*a44);
  a55=(a55+a44);
  a44=(a15*a14);
  a44=(a7*a44);
  a78=(a44*a41);
  a79=(a15*a77);
  a79=(a7*a79);
  a80=(a75*a79);
  a78=(a78+a80);
  a80=(a24*a78);
  a55=(a55+a80);
  a55=(a65*a55);
  a80=(a14*a76);
  a81=(a75*a44);
  a81=(a30+a81);
  a82=(a24*a81);
  a80=(a80+a82);
  a82=(a80*a68);
  a55=(a55-a82);
  a82=(a65*a74);
  a83=(a7*a82);
  a83=(a83-a44);
  a84=(a14*a83);
  a85=(a14*a82);
  a85=(a7*a85);
  a84=(a84-a85);
  a85=(a84*a66);
  a86=(a83*a77);
  a42=(a65*a42);
  a87=(a74*a68);
  a42=(a42-a87);
  a87=(a7*a42);
  a87=(a87-a79);
  a87=(a14*a87);
  a86=(a86+a87);
  a87=(a82*a77);
  a42=(a14*a42);
  a87=(a87+a42);
  a87=(a7*a87);
  a86=(a86-a87);
  a86=(a67*a86);
  a85=(a85+a86);
  a55=(a55-a85);
  a55=(a55/a69);
  a85=(a65*a80);
  a86=(a67*a84);
  a85=(a85-a86);
  a85=(a35-a85);
  a85=(a85/a69);
  a86=(a85/a69);
  a86=(a86*a72);
  a55=(a55+a86);
  a58=(a58-a55);
  a55=(a2*a58);
  a23=(a23+a55);
  a23=(a3*a23);
  a23=(a2*a23);
  if (res[0]!=0) res[0][2]=a23;
  a26=(a5*a26);
  a26=(a4*a26);
  a57=(a36*a57);
  a57=(a4*a57);
  a26=(a26+a57);
  a78=(a54*a78);
  a58=(a65*a58);
  a57=(a6*a70);
  a57=(a85+a57);
  a68=(a57*a68);
  a58=(a58-a68);
  a66=(a6*a66);
  a58=(a58+a66);
  a77=(a75*a77);
  a41=(a14*a41);
  a77=(a77+a41);
  a58=(a58-a77);
  a58=(a24*a58);
  a78=(a78-a58);
  a78=(a2*a78);
  a26=(a26+a78);
  a26=(a3*a26);
  a26=(a2*a26);
  a26=(a0+a26);
  if (res[0]!=0) res[0][3]=a26;
  a26=(a7*a13);
  a26=(a19*a26);
  a78=(a25*a13);
  a58=(a24*a78);
  a26=(a26+a58);
  a26=(a9*a26);
  a58=(a7*a9);
  a58=(a19*a58);
  a77=(a19*a9);
  a77=(a7*a77);
  a58=(a58-a77);
  a58=(a13*a58);
  a26=(a26-a58);
  a26=(a26/a17);
  a58=(a5*a26);
  a58=(a0-a58);
  a58=(a4*a58);
  a58=(a0+a58);
  a78=(a54*a78);
  a77=(a9*a26);
  a41=(a19*a13);
  a77=(a77+a41);
  a77=(a24*a77);
  a78=(a78+a77);
  a77=(a48*a78);
  a41=(a53*a77);
  a26=(a48*a26);
  a26=(a0-a26);
  a66=(a43*a26);
  a68=(a7*a66);
  a68=(a11*a68);
  a41=(a41+a68);
  a68=(a56*a66);
  a23=(a15*a77);
  a23=(a7*a23);
  a55=(a52*a23);
  a68=(a68+a55);
  a55=(a24*a68);
  a41=(a41+a55);
  a41=(a39*a41);
  a55=(a62*a77);
  a26=(a39*a26);
  a86=(a7*a26);
  a86=(a86-a23);
  a86=(a11*a86);
  a55=(a55+a86);
  a86=(a61*a77);
  a26=(a11*a26);
  a86=(a86+a26);
  a86=(a7*a86);
  a55=(a55-a86);
  a55=(a43*a55);
  a41=(a41-a55);
  a41=(a41/a46);
  a55=(a36*a41);
  a55=(a0-a55);
  a55=(a4*a55);
  a58=(a58+a55);
  a55=cos(a31);
  a86=(a5*a78);
  a86=(a22*a86);
  a26=(a55*a86);
  a23=(a49*a26);
  a72=sin(a31);
  a86=(a72*a86);
  a87=(a7*a86);
  a87=(a67*a87);
  a23=(a23-a87);
  a23=(a23/a69);
  a87=(a70/a69);
  a42=(a7*a26);
  a42=(a67*a42);
  a79=(a12*a26);
  a42=(a42+a79);
  a79=(a87*a42);
  a23=(a23-a79);
  a23=(a6*a23);
  a68=(a54*a68);
  a79=(a39*a41);
  a77=(a52*a77);
  a66=(a11*a66);
  a77=(a77+a66);
  a79=(a79+a77);
  a79=(a24*a79);
  a68=(a68+a79);
  a79=(a71*a68);
  a77=(a76*a79);
  a66=(a74*a26);
  a41=(a71*a41);
  a41=(a0-a41);
  a88=(a67*a41);
  a66=(a66+a88);
  a88=(a7*a66);
  a88=(a14*a88);
  a77=(a77+a88);
  a88=(a44*a66);
  a89=(a15*a79);
  a89=(a7*a89);
  a90=(a75*a89);
  a88=(a88+a90);
  a90=(a24*a88);
  a77=(a77+a90);
  a77=(a65*a77);
  a90=(a80*a86);
  a77=(a77-a90);
  a90=(a84*a26);
  a91=(a83*a79);
  a41=(a65*a41);
  a92=(a74*a86);
  a41=(a41-a92);
  a92=(a7*a41);
  a92=(a92-a89);
  a92=(a14*a92);
  a91=(a91+a92);
  a92=(a82*a79);
  a41=(a14*a41);
  a92=(a92+a41);
  a92=(a7*a92);
  a91=(a91-a92);
  a91=(a67*a91);
  a90=(a90+a91);
  a77=(a77-a90);
  a77=(a77/a69);
  a90=(a85/a69);
  a42=(a90*a42);
  a77=(a77+a42);
  a23=(a23-a77);
  a77=(a2*a23);
  a77=(a0+a77);
  a58=(a58+a77);
  a58=(a3*a58);
  a58=(a2*a58);
  if (res[1]!=0) res[1][0]=a58;
  a78=(a5*a78);
  a78=(a4*a78);
  a68=(a36*a68);
  a68=(a4*a68);
  a78=(a78+a68);
  a88=(a54*a88);
  a23=(a65*a23);
  a86=(a57*a86);
  a23=(a23-a86);
  a26=(a6*a26);
  a23=(a23+a26);
  a79=(a75*a79);
  a66=(a14*a66);
  a79=(a79+a66);
  a23=(a23-a79);
  a23=(a24*a23);
  a88=(a88-a23);
  a88=(a2*a88);
  a78=(a78+a88);
  a78=(a3*a78);
  a78=(a2*a78);
  if (res[1]!=0) res[1][1]=a78;
  a78=cos(a38);
  a78=(a78*a20);
  a88=(a40*a78);
  a23=sin(a38);
  a23=(a23*a20);
  a79=(a7*a23);
  a79=(a43*a79);
  a88=(a88-a79);
  a88=(a88/a46);
  a79=(a47/a46);
  a66=(a7*a78);
  a66=(a43*a66);
  a26=(a45*a78);
  a66=(a66+a26);
  a79=(a79*a66);
  a88=(a88-a79);
  a88=(a6*a88);
  a79=1.0000000000000001e-01;
  a26=(a79*a27);
  a86=(a54*a26);
  a26=(a24*a26);
  a26=(a28+a26);
  a26=(a9*a26);
  a68=-1.0000000000000001e-01;
  a58=(a68*a19);
  a58=(a33+a58);
  a77=(a7*a32);
  a58=(a58-a77);
  a58=(a13*a58);
  a26=(a26-a58);
  a26=(a26/a17);
  a58=(a9*a26);
  a58=(a58+a27);
  a58=(a24*a58);
  a86=(a86+a58);
  a58=(a48*a86);
  a58=(a0+a58);
  a77=(a53*a58);
  a42=(a51*a78);
  a91=(a48*a26);
  a92=(a43*a91);
  a42=(a42-a92);
  a92=(a7*a42);
  a92=(a11*a92);
  a77=(a77+a92);
  a92=(a56*a42);
  a41=(a15*a58);
  a41=(a7*a41);
  a89=(a52*a41);
  a92=(a92+a89);
  a89=(a24*a92);
  a77=(a77+a89);
  a77=(a39*a77);
  a89=(a59*a23);
  a77=(a77-a89);
  a89=(a63*a78);
  a93=(a62*a58);
  a94=(a51*a23);
  a91=(a39*a91);
  a94=(a94+a91);
  a91=(a7*a94);
  a91=(a91+a41);
  a91=(a11*a91);
  a93=(a93-a91);
  a91=(a61*a58);
  a94=(a11*a94);
  a91=(a91-a94);
  a91=(a7*a91);
  a93=(a93-a91);
  a93=(a43*a93);
  a89=(a89+a93);
  a77=(a77-a89);
  a77=(a77/a46);
  a89=(a64/a46);
  a89=(a89*a66);
  a77=(a77+a89);
  a88=(a88-a77);
  a77=(a36*a88);
  a77=(a4*a77);
  a26=(a5*a26);
  a26=(a4*a26);
  a77=(a77-a26);
  a26=(a5*a86);
  a26=(a0+a26);
  a26=(a22*a26);
  a55=(a55*a26);
  a89=(a49*a55);
  a72=(a72*a26);
  a26=(a7*a72);
  a26=(a67*a26);
  a89=(a89-a26);
  a89=(a89/a69);
  a26=(a7*a55);
  a26=(a67*a26);
  a66=(a12*a55);
  a26=(a26+a66);
  a87=(a87*a26);
  a89=(a89-a87);
  a89=(a6*a89);
  a92=(a54*a92);
  a87=(a39*a88);
  a23=(a73*a23);
  a87=(a87-a23);
  a78=(a6*a78);
  a87=(a87+a78);
  a58=(a52*a58);
  a42=(a11*a42);
  a58=(a58+a42);
  a87=(a87-a58);
  a87=(a24*a87);
  a92=(a92-a87);
  a87=(a71*a92);
  a87=(a0+a87);
  a58=(a76*a87);
  a42=(a74*a55);
  a88=(a71*a88);
  a78=(a67*a88);
  a42=(a42+a78);
  a78=(a7*a42);
  a78=(a14*a78);
  a58=(a58+a78);
  a78=(a44*a42);
  a23=(a15*a87);
  a23=(a7*a23);
  a66=(a75*a23);
  a78=(a78+a66);
  a66=(a24*a78);
  a58=(a58+a66);
  a58=(a65*a58);
  a66=(a80*a72);
  a58=(a58-a66);
  a66=(a84*a55);
  a93=(a83*a87);
  a88=(a65*a88);
  a91=(a74*a72);
  a88=(a88-a91);
  a91=(a7*a88);
  a91=(a91-a23);
  a91=(a14*a91);
  a93=(a93+a91);
  a91=(a82*a87);
  a88=(a14*a88);
  a91=(a91+a88);
  a91=(a7*a91);
  a93=(a93-a91);
  a93=(a67*a93);
  a66=(a66+a93);
  a58=(a58-a66);
  a58=(a58/a69);
  a90=(a90*a26);
  a58=(a58+a90);
  a89=(a89-a58);
  a58=(a2*a89);
  a77=(a77+a58);
  a77=(a3*a77);
  a77=(a2*a77);
  if (res[1]!=0) res[1][2]=a77;
  a86=(a5*a86);
  a86=(a0+a86);
  a86=(a4*a86);
  a86=(a0+a86);
  a92=(a36*a92);
  a92=(a0+a92);
  a92=(a4*a92);
  a86=(a86+a92);
  a78=(a54*a78);
  a89=(a65*a89);
  a72=(a57*a72);
  a89=(a89-a72);
  a55=(a6*a55);
  a89=(a89+a55);
  a87=(a75*a87);
  a42=(a14*a42);
  a87=(a87+a42);
  a89=(a89-a87);
  a89=(a24*a89);
  a78=(a78-a89);
  a78=(a2*a78);
  a78=(a0+a78);
  a86=(a86+a78);
  a86=(a3*a86);
  a86=(a2*a86);
  if (res[1]!=0) res[1][3]=a86;
  a86=(a5/a17);
  a86=(a4*a86);
  a78=(a48/a17);
  a89=(a43*a78);
  a87=(a7*a89);
  a87=(a11*a87);
  a42=(a9/a17);
  a42=(a24*a42);
  a55=(a48*a42);
  a72=(a53*a55);
  a87=(a87-a72);
  a72=(a56*a89);
  a92=(a15*a55);
  a92=(a7*a92);
  a77=(a52*a92);
  a72=(a72-a77);
  a77=(a24*a72);
  a87=(a87+a77);
  a87=(a39*a87);
  a78=(a39*a78);
  a77=(a7*a78);
  a77=(a77+a92);
  a77=(a11*a77);
  a92=(a62*a55);
  a77=(a77-a92);
  a78=(a11*a78);
  a92=(a61*a55);
  a78=(a78-a92);
  a78=(a7*a78);
  a77=(a77-a78);
  a77=(a43*a77);
  a87=(a87-a77);
  a87=(a0-a87);
  a87=(a87/a46);
  a77=(a36*a87);
  a77=(a4*a77);
  a86=(a86+a77);
  a77=sin(a31);
  a78=(a5*a42);
  a78=(a22*a78);
  a92=(a77*a78);
  a58=(a80*a92);
  a72=(a54*a72);
  a90=(a39*a87);
  a89=(a11*a89);
  a55=(a52*a55);
  a89=(a89-a55);
  a90=(a90-a89);
  a90=(a24*a90);
  a72=(a72-a90);
  a90=(a71*a72);
  a89=(a76*a90);
  a87=(a71*a87);
  a55=(a67*a87);
  a26=cos(a31);
  a78=(a26*a78);
  a66=(a74*a78);
  a55=(a55-a66);
  a66=(a7*a55);
  a66=(a14*a66);
  a89=(a89+a66);
  a66=(a44*a55);
  a93=(a15*a90);
  a93=(a7*a93);
  a91=(a75*a93);
  a66=(a66+a91);
  a91=(a24*a66);
  a89=(a89+a91);
  a89=(a65*a89);
  a58=(a58+a89);
  a89=(a83*a90);
  a91=(a74*a92);
  a87=(a65*a87);
  a91=(a91+a87);
  a87=(a7*a91);
  a87=(a87-a93);
  a87=(a14*a87);
  a89=(a89+a87);
  a87=(a82*a90);
  a91=(a14*a91);
  a87=(a87+a91);
  a87=(a7*a87);
  a89=(a89-a87);
  a89=(a67*a89);
  a87=(a84*a78);
  a89=(a89-a87);
  a58=(a58-a89);
  a58=(a0-a58);
  a58=(a58/a69);
  a89=(a85/a69);
  a87=(a7*a78);
  a87=(a67*a87);
  a91=(a12*a78);
  a87=(a87+a91);
  a91=(a89*a87);
  a58=(a58+a91);
  a91=(a7*a92);
  a91=(a67*a91);
  a93=(a49*a78);
  a91=(a91-a93);
  a91=(a91/a69);
  a93=(a70/a69);
  a87=(a93*a87);
  a91=(a91+a87);
  a91=(a6*a91);
  a58=(a58+a91);
  a91=(a2*a58);
  a86=(a86+a91);
  a86=(a3*a86);
  a86=(a2*a86);
  if (res[2]!=0) res[2][0]=a86;
  a72=(a36*a72);
  a72=(a4*a72);
  a42=(a5*a42);
  a42=(a4*a42);
  a72=(a72-a42);
  a66=(a54*a66);
  a92=(a57*a92);
  a58=(a65*a58);
  a92=(a92+a58);
  a78=(a6*a78);
  a92=(a92-a78);
  a90=(a75*a90);
  a55=(a14*a55);
  a90=(a90+a55);
  a92=(a92-a90);
  a92=(a24*a92);
  a66=(a66-a92);
  a66=(a2*a66);
  a72=(a72+a66);
  a72=(a3*a72);
  a72=(a2*a72);
  if (res[2]!=0) res[2][1]=a72;
  a72=(a24*a9);
  a72=(a72/a17);
  a66=(a9*a72);
  a66=(a24*a66);
  a66=(a54+a66);
  a92=(a5*a66);
  a92=(a22*a92);
  a26=(a26*a92);
  a90=(a49*a26);
  a77=(a77*a92);
  a92=(a7*a77);
  a92=(a67*a92);
  a90=(a90-a92);
  a90=(a90/a69);
  a92=(a7*a26);
  a92=(a67*a92);
  a55=(a12*a26);
  a92=(a92+a55);
  a93=(a93*a92);
  a90=(a90-a93);
  a90=(a6*a90);
  a93=(a48*a66);
  a55=(a15*a93);
  a55=(a7*a55);
  a78=(a52*a55);
  a58=(a48*a72);
  a42=(a43*a58);
  a86=(a56*a42);
  a78=(a78-a86);
  a78=(a0+a78);
  a86=(a54*a78);
  a91=(a53*a93);
  a87=(a7*a42);
  a87=(a11*a87);
  a91=(a91-a87);
  a78=(a24*a78);
  a91=(a91+a78);
  a91=(a39*a91);
  a78=(a62*a93);
  a58=(a39*a58);
  a87=(a7*a58);
  a87=(a87+a55);
  a87=(a11*a87);
  a78=(a78-a87);
  a87=(a61*a93);
  a58=(a11*a58);
  a87=(a87-a58);
  a87=(a7*a87);
  a78=(a78-a87);
  a78=(a43*a78);
  a91=(a91-a78);
  a91=(a91/a46);
  a78=(a39*a91);
  a93=(a52*a93);
  a42=(a11*a42);
  a93=(a93-a42);
  a78=(a78+a93);
  a78=(a24*a78);
  a86=(a86+a78);
  a78=(a71*a86);
  a93=(a76*a78);
  a42=(a74*a26);
  a87=(a71*a91);
  a58=(a67*a87);
  a42=(a42-a58);
  a58=(a7*a42);
  a58=(a14*a58);
  a93=(a93+a58);
  a58=(a44*a42);
  a55=(a15*a78);
  a55=(a7*a55);
  a88=(a75*a55);
  a58=(a58+a88);
  a58=(a0+a58);
  a88=(a24*a58);
  a93=(a93+a88);
  a93=(a65*a93);
  a88=(a80*a77);
  a93=(a93-a88);
  a88=(a84*a26);
  a23=(a83*a78);
  a94=(a74*a77);
  a87=(a65*a87);
  a94=(a94+a87);
  a87=(a7*a94);
  a87=(a87+a55);
  a87=(a14*a87);
  a23=(a23-a87);
  a87=(a82*a78);
  a94=(a14*a94);
  a87=(a87-a94);
  a87=(a7*a87);
  a23=(a23-a87);
  a23=(a67*a23);
  a88=(a88+a23);
  a93=(a93-a88);
  a93=(a93/a69);
  a89=(a89*a92);
  a93=(a93+a89);
  a90=(a90-a93);
  a93=(a2*a90);
  a72=(a5*a72);
  a72=(a4*a72);
  a91=(a36*a91);
  a91=(a4*a91);
  a72=(a72+a91);
  a93=(a93-a72);
  a93=(a3*a93);
  a93=(a2*a93);
  if (res[2]!=0) res[2][2]=a93;
  a66=(a5*a66);
  a66=(a4*a66);
  a86=(a36*a86);
  a86=(a4*a86);
  a66=(a66+a86);
  a58=(a54*a58);
  a90=(a65*a90);
  a77=(a57*a77);
  a90=(a90-a77);
  a26=(a6*a26);
  a90=(a90+a26);
  a78=(a75*a78);
  a42=(a14*a42);
  a78=(a78+a42);
  a90=(a90-a78);
  a90=(a24*a90);
  a58=(a58-a90);
  a58=(a2*a58);
  a66=(a66+a58);
  a66=(a3*a66);
  a66=(a2*a66);
  if (res[2]!=0) res[2][3]=a66;
  if (res[3]!=0) res[3][0]=a1;
  if (res[3]!=0) res[3][1]=a1;
  a1=cos(a8);
  a10=(a10*a1);
  a66=sin(a8);
  a58=(a7*a66);
  a58=(a13*a58);
  a10=(a10-a58);
  a10=(a10/a17);
  a18=(a18/a17);
  a58=(a7*a1);
  a58=(a13*a58);
  a16=(a16*a1);
  a58=(a58+a16);
  a18=(a18*a58);
  a10=(a10-a18);
  a10=(a6*a10);
  a18=(a21*a1);
  a16=(a7*a18);
  a16=(a19*a16);
  a90=(a25*a18);
  a78=(a24*a90);
  a16=(a16+a78);
  a16=(a9*a16);
  a29=(a29*a66);
  a16=(a16-a29);
  a34=(a34*a1);
  a29=(a21*a66);
  a78=(a19*a29);
  a78=(a7*a78);
  a29=(a7*a29);
  a29=(a19*a29);
  a78=(a78-a29);
  a78=(a13*a78);
  a34=(a34+a78);
  a16=(a16-a34);
  a16=(a16/a17);
  a37=(a37/a17);
  a37=(a37*a58);
  a16=(a16+a37);
  a10=(a10-a16);
  a16=cos(a38);
  a37=(a40*a16);
  a58=sin(a38);
  a34=(a7*a58);
  a34=(a43*a34);
  a37=(a37-a34);
  a37=(a37/a46);
  a34=(a47/a46);
  a78=(a7*a16);
  a78=(a43*a78);
  a29=(a45*a16);
  a78=(a78+a29);
  a34=(a34*a78);
  a37=(a37-a34);
  a37=(a6*a37);
  a90=(a54*a90);
  a34=(a9*a10);
  a50=(a50*a66);
  a34=(a34-a50);
  a1=(a6*a1);
  a34=(a34+a1);
  a18=(a19*a18);
  a34=(a34-a18);
  a34=(a24*a34);
  a90=(a90-a34);
  a34=(a48*a90);
  a18=(a53*a34);
  a1=(a51*a16);
  a50=(a48*a10);
  a66=(a43*a50);
  a1=(a1+a66);
  a66=(a7*a1);
  a66=(a11*a66);
  a18=(a18+a66);
  a66=(a56*a1);
  a29=(a15*a34);
  a29=(a7*a29);
  a42=(a52*a29);
  a66=(a66+a42);
  a42=(a24*a66);
  a18=(a18+a42);
  a18=(a39*a18);
  a42=(a59*a58);
  a18=(a18-a42);
  a42=(a63*a16);
  a26=(a62*a34);
  a50=(a39*a50);
  a77=(a51*a58);
  a50=(a50-a77);
  a77=(a7*a50);
  a77=(a77-a29);
  a77=(a11*a77);
  a26=(a26+a77);
  a77=(a61*a34);
  a50=(a11*a50);
  a77=(a77+a50);
  a77=(a7*a77);
  a26=(a26-a77);
  a26=(a43*a26);
  a42=(a42+a26);
  a18=(a18-a42);
  a18=(a18/a46);
  a42=(a64/a46);
  a42=(a42*a78);
  a18=(a18+a42);
  a37=(a37-a18);
  a18=(a4*a37);
  a10=(a10+a18);
  a18=cos(a31);
  a42=(a5*a90);
  a42=(a22*a42);
  a42=(a0+a42);
  a18=(a18*a42);
  a78=(a49*a18);
  a26=sin(a31);
  a26=(a26*a42);
  a42=(a7*a26);
  a42=(a67*a42);
  a78=(a78-a42);
  a78=(a78/a69);
  a42=(a70/a69);
  a77=(a7*a18);
  a77=(a67*a77);
  a50=(a12*a18);
  a77=(a77+a50);
  a42=(a42*a77);
  a78=(a78-a42);
  a78=(a6*a78);
  a66=(a54*a66);
  a42=(a39*a37);
  a58=(a73*a58);
  a42=(a42-a58);
  a16=(a6*a16);
  a42=(a42+a16);
  a34=(a52*a34);
  a1=(a11*a1);
  a34=(a34+a1);
  a42=(a42-a34);
  a42=(a24*a42);
  a66=(a66-a42);
  a42=(a71*a66);
  a34=(a76*a42);
  a1=(a74*a18);
  a37=(a71*a37);
  a16=(a67*a37);
  a1=(a1+a16);
  a16=(a7*a1);
  a16=(a14*a16);
  a34=(a34+a16);
  a16=(a44*a1);
  a58=(a15*a42);
  a58=(a7*a58);
  a50=(a75*a58);
  a16=(a16+a50);
  a50=(a24*a16);
  a34=(a34+a50);
  a34=(a65*a34);
  a50=(a80*a26);
  a34=(a34-a50);
  a50=(a84*a18);
  a29=(a83*a42);
  a37=(a65*a37);
  a86=(a74*a26);
  a37=(a37-a86);
  a86=(a7*a37);
  a86=(a86-a58);
  a86=(a14*a86);
  a29=(a29+a86);
  a86=(a82*a42);
  a37=(a14*a37);
  a86=(a86+a37);
  a86=(a7*a86);
  a29=(a29-a86);
  a29=(a67*a29);
  a50=(a50+a29);
  a34=(a34-a50);
  a34=(a34/a69);
  a50=(a85/a69);
  a50=(a50*a77);
  a34=(a34+a50);
  a78=(a78-a34);
  a34=(a4*a78);
  a10=(a10+a34);
  a60=(a36*a60);
  a60=(a19+a60);
  a60=(a2*a60);
  a8=(a8+a60);
  a60=cos(a8);
  a34=(a7*a60);
  a50=cos(a8);
  a77=(a36*a66);
  a77=(a2*a77);
  a77=(a0+a77);
  a50=(a50*a77);
  a29=(a34*a50);
  a86=sin(a8);
  a37=sin(a8);
  a37=(a37*a77);
  a77=(a7*a37);
  a77=(a86*a77);
  a29=(a29-a77);
  a77=(a7*a86);
  a58=(a77*a86);
  a58=(a15+a58);
  a29=(a29/a58);
  a93=(a34*a86);
  a93=(a93/a58);
  a72=(a93/a58);
  a91=(a7*a50);
  a91=(a86*a91);
  a89=(a77*a50);
  a91=(a91+a89);
  a72=(a72*a91);
  a29=(a29-a72);
  a29=(a6*a29);
  a72=(a2*a57);
  a21=(a21+a72);
  a72=(a86*a21);
  a89=(a7*a72);
  a16=(a54*a16);
  a92=(a65*a78);
  a26=(a57*a26);
  a92=(a92-a26);
  a18=(a6*a18);
  a92=(a92+a18);
  a42=(a75*a42);
  a1=(a14*a1);
  a42=(a42+a1);
  a92=(a92-a42);
  a92=(a24*a92);
  a16=(a16-a92);
  a92=(a2*a16);
  a42=(a89*a92);
  a81=(a54*a81);
  a1=(a65*a57);
  a18=(a6*a67);
  a1=(a1+a18);
  a18=(a14*a75);
  a1=(a1-a18);
  a1=(a24*a1);
  a81=(a81-a1);
  a81=(a2*a81);
  a81=(a19+a81);
  a1=(a21*a50);
  a78=(a2*a78);
  a18=(a86*a78);
  a1=(a1+a18);
  a18=(a7*a1);
  a18=(a81*a18);
  a42=(a42+a18);
  a18=(a15*a81);
  a18=(a7*a18);
  a26=(a18*a1);
  a88=(a15*a92);
  a88=(a7*a88);
  a23=(a72*a88);
  a26=(a26+a23);
  a23=(a24*a26);
  a42=(a42+a23);
  a42=(a60*a42);
  a23=(a81*a89);
  a87=(a72*a18);
  a30=(a30+a87);
  a30=(a24*a30);
  a23=(a23+a30);
  a30=(a23*a37);
  a42=(a42-a30);
  a30=(a60*a21);
  a87=(a7*a30);
  a87=(a87-a18);
  a94=(a81*a87);
  a55=(a81*a30);
  a55=(a7*a55);
  a94=(a94-a55);
  a55=(a94*a50);
  a41=(a87*a92);
  a78=(a60*a78);
  a95=(a21*a37);
  a78=(a78-a95);
  a95=(a7*a78);
  a95=(a95-a88);
  a95=(a81*a95);
  a41=(a41+a95);
  a95=(a30*a92);
  a78=(a81*a78);
  a95=(a95+a78);
  a95=(a7*a95);
  a41=(a41-a95);
  a41=(a86*a41);
  a55=(a55+a41);
  a42=(a42-a55);
  a42=(a42/a58);
  a55=(a60*a23);
  a41=(a86*a94);
  a55=(a55-a41);
  a35=(a35-a55);
  a35=(a35/a58);
  a55=(a35/a58);
  a55=(a55*a91);
  a42=(a42+a55);
  a29=(a29-a42);
  a10=(a10+a29);
  a10=(a3*a10);
  a10=(a2*a10);
  if (res[3]!=0) res[3][2]=a10;
  a66=(a4*a66);
  a90=(a90+a66);
  a16=(a4*a16);
  a90=(a90+a16);
  a26=(a54*a26);
  a29=(a60*a29);
  a16=(a6*a93);
  a16=(a35+a16);
  a37=(a16*a37);
  a29=(a29-a37);
  a50=(a6*a50);
  a29=(a29+a50);
  a92=(a72*a92);
  a1=(a81*a1);
  a92=(a92+a1);
  a29=(a29-a92);
  a29=(a24*a29);
  a26=(a26-a29);
  a90=(a90+a26);
  a90=(a3*a90);
  a90=(a2*a90);
  if (res[3]!=0) res[3][3]=a90;
  a90=cos(a31);
  a25=(a25*a13);
  a26=(a54*a25);
  a29=(a7*a13);
  a29=(a19*a29);
  a25=(a24*a25);
  a29=(a29+a25);
  a29=(a9*a29);
  a25=(a7*a9);
  a25=(a19*a25);
  a92=(a19*a9);
  a92=(a7*a92);
  a25=(a25-a92);
  a25=(a13*a25);
  a29=(a29-a25);
  a29=(a29/a17);
  a25=(a9*a29);
  a92=(a19*a13);
  a25=(a25+a92);
  a25=(a24*a25);
  a26=(a26+a25);
  a25=(a5*a26);
  a25=(a22*a25);
  a92=(a90*a25);
  a1=(a49*a92);
  a50=sin(a31);
  a25=(a50*a25);
  a37=(a7*a25);
  a37=(a67*a37);
  a1=(a1-a37);
  a1=(a1/a69);
  a37=(a70/a69);
  a66=(a7*a92);
  a66=(a67*a66);
  a10=(a12*a92);
  a66=(a66+a10);
  a10=(a37*a66);
  a1=(a1-a10);
  a1=(a6*a1);
  a10=(a48*a29);
  a10=(a0-a10);
  a42=(a43*a10);
  a55=(a56*a42);
  a91=(a48*a26);
  a41=(a15*a91);
  a41=(a7*a41);
  a95=(a52*a41);
  a55=(a55+a95);
  a95=(a54*a55);
  a78=(a53*a91);
  a88=(a7*a42);
  a88=(a11*a88);
  a78=(a78+a88);
  a55=(a24*a55);
  a78=(a78+a55);
  a78=(a39*a78);
  a55=(a62*a91);
  a10=(a39*a10);
  a88=(a7*a10);
  a88=(a88-a41);
  a88=(a11*a88);
  a55=(a55+a88);
  a88=(a61*a91);
  a10=(a11*a10);
  a88=(a88+a10);
  a88=(a7*a88);
  a55=(a55-a88);
  a55=(a43*a55);
  a78=(a78-a55);
  a78=(a78/a46);
  a55=(a39*a78);
  a91=(a52*a91);
  a42=(a11*a42);
  a91=(a91+a42);
  a55=(a55+a91);
  a55=(a24*a55);
  a95=(a95+a55);
  a55=(a71*a95);
  a91=(a76*a55);
  a42=(a74*a92);
  a88=(a71*a78);
  a88=(a0-a88);
  a10=(a67*a88);
  a42=(a42+a10);
  a10=(a7*a42);
  a10=(a14*a10);
  a91=(a91+a10);
  a10=(a44*a42);
  a41=(a15*a55);
  a41=(a7*a41);
  a96=(a75*a41);
  a10=(a10+a96);
  a96=(a24*a10);
  a91=(a91+a96);
  a91=(a65*a91);
  a96=(a80*a25);
  a91=(a91-a96);
  a96=(a84*a92);
  a97=(a83*a55);
  a88=(a65*a88);
  a98=(a74*a25);
  a88=(a88-a98);
  a98=(a7*a88);
  a98=(a98-a41);
  a98=(a14*a98);
  a97=(a97+a98);
  a98=(a82*a55);
  a88=(a14*a88);
  a98=(a98+a88);
  a98=(a7*a98);
  a97=(a97-a98);
  a97=(a67*a97);
  a96=(a96+a97);
  a91=(a91-a96);
  a91=(a91/a69);
  a96=(a85/a69);
  a66=(a96*a66);
  a91=(a91+a66);
  a1=(a1-a91);
  a91=(a4*a1);
  a78=(a4*a78);
  a29=(a29+a78);
  a91=(a91-a29);
  a29=cos(a8);
  a78=(a36*a95);
  a78=(a2*a78);
  a66=(a29*a78);
  a97=(a34*a66);
  a98=sin(a8);
  a78=(a98*a78);
  a88=(a7*a78);
  a88=(a86*a88);
  a97=(a97-a88);
  a97=(a97/a58);
  a88=(a93/a58);
  a41=(a7*a66);
  a41=(a86*a41);
  a99=(a77*a66);
  a41=(a41+a99);
  a99=(a88*a41);
  a97=(a97-a99);
  a97=(a6*a97);
  a10=(a54*a10);
  a99=(a65*a1);
  a25=(a57*a25);
  a99=(a99-a25);
  a92=(a6*a92);
  a99=(a99+a92);
  a55=(a75*a55);
  a42=(a14*a42);
  a55=(a55+a42);
  a99=(a99-a55);
  a99=(a24*a99);
  a10=(a10-a99);
  a99=(a2*a10);
  a55=(a89*a99);
  a42=(a21*a66);
  a1=(a2*a1);
  a1=(a0+a1);
  a92=(a86*a1);
  a42=(a42+a92);
  a92=(a7*a42);
  a92=(a81*a92);
  a55=(a55+a92);
  a92=(a18*a42);
  a25=(a15*a99);
  a25=(a7*a25);
  a100=(a72*a25);
  a92=(a92+a100);
  a100=(a24*a92);
  a55=(a55+a100);
  a55=(a60*a55);
  a100=(a23*a78);
  a55=(a55-a100);
  a100=(a94*a66);
  a101=(a87*a99);
  a1=(a60*a1);
  a102=(a21*a78);
  a1=(a1-a102);
  a102=(a7*a1);
  a102=(a102-a25);
  a102=(a81*a102);
  a101=(a101+a102);
  a102=(a30*a99);
  a1=(a81*a1);
  a102=(a102+a1);
  a102=(a7*a102);
  a101=(a101-a102);
  a101=(a86*a101);
  a100=(a100+a101);
  a55=(a55-a100);
  a55=(a55/a58);
  a100=(a35/a58);
  a41=(a100*a41);
  a55=(a55+a41);
  a97=(a97-a55);
  a91=(a91+a97);
  a91=(a3*a91);
  a91=(a2*a91);
  a91=(a0+a91);
  if (res[4]!=0) res[4][0]=a91;
  a95=(a4*a95);
  a26=(a26+a95);
  a10=(a4*a10);
  a26=(a26+a10);
  a92=(a54*a92);
  a97=(a60*a97);
  a78=(a16*a78);
  a97=(a97-a78);
  a66=(a6*a66);
  a97=(a97+a66);
  a99=(a72*a99);
  a42=(a81*a42);
  a99=(a99+a42);
  a97=(a97-a99);
  a97=(a24*a97);
  a92=(a92-a97);
  a26=(a26+a92);
  a26=(a3*a26);
  a26=(a2*a26);
  if (res[4]!=0) res[4][1]=a26;
  a26=cos(a38);
  a26=(a26*a20);
  a40=(a40*a26);
  a38=sin(a38);
  a38=(a38*a20);
  a20=(a7*a38);
  a20=(a43*a20);
  a40=(a40-a20);
  a40=(a40/a46);
  a47=(a47/a46);
  a20=(a7*a26);
  a20=(a43*a20);
  a45=(a45*a26);
  a20=(a20+a45);
  a47=(a47*a20);
  a40=(a40-a47);
  a40=(a6*a40);
  a79=(a79*a27);
  a47=(a54*a79);
  a79=(a24*a79);
  a28=(a28+a79);
  a28=(a9*a28);
  a68=(a68*a19);
  a33=(a33+a68);
  a32=(a7*a32);
  a33=(a33-a32);
  a13=(a13*a33);
  a28=(a28-a13);
  a28=(a28/a17);
  a13=(a9*a28);
  a13=(a13+a27);
  a13=(a24*a13);
  a47=(a47+a13);
  a13=(a48*a47);
  a13=(a0+a13);
  a27=(a53*a13);
  a33=(a51*a26);
  a32=(a48*a28);
  a68=(a43*a32);
  a33=(a33-a68);
  a68=(a7*a33);
  a68=(a11*a68);
  a27=(a27+a68);
  a68=(a56*a33);
  a19=(a15*a13);
  a19=(a7*a19);
  a79=(a52*a19);
  a68=(a68+a79);
  a79=(a24*a68);
  a27=(a27+a79);
  a27=(a39*a27);
  a59=(a59*a38);
  a27=(a27-a59);
  a63=(a63*a26);
  a59=(a62*a13);
  a51=(a51*a38);
  a32=(a39*a32);
  a51=(a51+a32);
  a32=(a7*a51);
  a32=(a32+a19);
  a32=(a11*a32);
  a59=(a59-a32);
  a32=(a61*a13);
  a51=(a11*a51);
  a32=(a32-a51);
  a32=(a7*a32);
  a59=(a59-a32);
  a59=(a43*a59);
  a63=(a63+a59);
  a27=(a27-a63);
  a27=(a27/a46);
  a64=(a64/a46);
  a64=(a64*a20);
  a27=(a27+a64);
  a40=(a40-a27);
  a27=(a4*a40);
  a27=(a27-a28);
  a28=(a5*a47);
  a28=(a0+a28);
  a28=(a22*a28);
  a90=(a90*a28);
  a64=(a49*a90);
  a50=(a50*a28);
  a28=(a7*a50);
  a28=(a67*a28);
  a64=(a64-a28);
  a64=(a64/a69);
  a28=(a7*a90);
  a28=(a67*a28);
  a20=(a12*a90);
  a28=(a28+a20);
  a37=(a37*a28);
  a64=(a64-a37);
  a64=(a6*a64);
  a68=(a54*a68);
  a37=(a39*a40);
  a73=(a73*a38);
  a37=(a37-a73);
  a26=(a6*a26);
  a37=(a37+a26);
  a13=(a52*a13);
  a33=(a11*a33);
  a13=(a13+a33);
  a37=(a37-a13);
  a37=(a24*a37);
  a68=(a68-a37);
  a37=(a71*a68);
  a37=(a0+a37);
  a13=(a76*a37);
  a33=(a74*a90);
  a40=(a71*a40);
  a26=(a67*a40);
  a33=(a33+a26);
  a26=(a7*a33);
  a26=(a14*a26);
  a13=(a13+a26);
  a26=(a44*a33);
  a73=(a15*a37);
  a73=(a7*a73);
  a38=(a75*a73);
  a26=(a26+a38);
  a38=(a24*a26);
  a13=(a13+a38);
  a13=(a65*a13);
  a38=(a80*a50);
  a13=(a13-a38);
  a38=(a84*a90);
  a20=(a83*a37);
  a40=(a65*a40);
  a63=(a74*a50);
  a40=(a40-a63);
  a63=(a7*a40);
  a63=(a63-a73);
  a63=(a14*a63);
  a20=(a20+a63);
  a63=(a82*a37);
  a40=(a14*a40);
  a63=(a63+a40);
  a63=(a7*a63);
  a20=(a20-a63);
  a20=(a67*a20);
  a38=(a38+a20);
  a13=(a13-a38);
  a13=(a13/a69);
  a96=(a96*a28);
  a13=(a13+a96);
  a64=(a64-a13);
  a13=(a4*a64);
  a27=(a27+a13);
  a13=(a36*a68);
  a13=(a0+a13);
  a13=(a2*a13);
  a29=(a29*a13);
  a96=(a34*a29);
  a98=(a98*a13);
  a13=(a7*a98);
  a13=(a86*a13);
  a96=(a96-a13);
  a96=(a96/a58);
  a13=(a7*a29);
  a13=(a86*a13);
  a28=(a77*a29);
  a13=(a13+a28);
  a88=(a88*a13);
  a96=(a96-a88);
  a96=(a6*a96);
  a26=(a54*a26);
  a88=(a65*a64);
  a50=(a57*a50);
  a88=(a88-a50);
  a90=(a6*a90);
  a88=(a88+a90);
  a37=(a75*a37);
  a33=(a14*a33);
  a37=(a37+a33);
  a88=(a88-a37);
  a88=(a24*a88);
  a26=(a26-a88);
  a88=(a2*a26);
  a88=(a0+a88);
  a37=(a89*a88);
  a33=(a21*a29);
  a64=(a2*a64);
  a90=(a86*a64);
  a33=(a33+a90);
  a90=(a7*a33);
  a90=(a81*a90);
  a37=(a37+a90);
  a90=(a18*a33);
  a50=(a15*a88);
  a50=(a7*a50);
  a28=(a72*a50);
  a90=(a90+a28);
  a28=(a24*a90);
  a37=(a37+a28);
  a37=(a60*a37);
  a28=(a23*a98);
  a37=(a37-a28);
  a28=(a94*a29);
  a38=(a87*a88);
  a64=(a60*a64);
  a20=(a21*a98);
  a64=(a64-a20);
  a20=(a7*a64);
  a20=(a20-a50);
  a20=(a81*a20);
  a38=(a38+a20);
  a20=(a30*a88);
  a64=(a81*a64);
  a20=(a20+a64);
  a20=(a7*a20);
  a38=(a38-a20);
  a38=(a86*a38);
  a28=(a28+a38);
  a37=(a37-a28);
  a37=(a37/a58);
  a100=(a100*a13);
  a37=(a37+a100);
  a96=(a96-a37);
  a27=(a27+a96);
  a27=(a3*a27);
  a27=(a2*a27);
  if (res[4]!=0) res[4][2]=a27;
  a68=(a4*a68);
  a47=(a47+a68);
  a26=(a4*a26);
  a47=(a47+a26);
  a90=(a54*a90);
  a96=(a60*a96);
  a98=(a16*a98);
  a96=(a96-a98);
  a29=(a6*a29);
  a96=(a96+a29);
  a88=(a72*a88);
  a33=(a81*a33);
  a88=(a88+a33);
  a96=(a96-a88);
  a96=(a24*a96);
  a90=(a90-a96);
  a47=(a47+a90);
  a47=(a3*a47);
  a47=(a2*a47);
  a47=(a0+a47);
  if (res[4]!=0) res[4][3]=a47;
  a47=(1./a17);
  a90=(a48/a17);
  a96=(a43*a90);
  a88=(a7*a96);
  a88=(a11*a88);
  a33=(a9/a17);
  a33=(a24*a33);
  a29=(a48*a33);
  a98=(a53*a29);
  a88=(a88-a98);
  a98=(a56*a96);
  a26=(a15*a29);
  a26=(a7*a26);
  a68=(a52*a26);
  a98=(a98-a68);
  a68=(a24*a98);
  a88=(a88+a68);
  a88=(a39*a88);
  a90=(a39*a90);
  a68=(a7*a90);
  a68=(a68+a26);
  a68=(a11*a68);
  a26=(a62*a29);
  a68=(a68-a26);
  a90=(a11*a90);
  a26=(a61*a29);
  a90=(a90-a26);
  a90=(a7*a90);
  a68=(a68-a90);
  a68=(a43*a68);
  a88=(a88-a68);
  a88=(a0-a88);
  a88=(a88/a46);
  a68=(a4*a88);
  a47=(a47+a68);
  a68=sin(a31);
  a90=(a5*a33);
  a90=(a22*a90);
  a26=(a68*a90);
  a27=(a80*a26);
  a98=(a54*a98);
  a37=(a39*a88);
  a96=(a11*a96);
  a29=(a52*a29);
  a96=(a96-a29);
  a37=(a37-a96);
  a37=(a24*a37);
  a98=(a98-a37);
  a37=(a71*a98);
  a96=(a76*a37);
  a88=(a71*a88);
  a29=(a67*a88);
  a31=cos(a31);
  a90=(a31*a90);
  a100=(a74*a90);
  a29=(a29-a100);
  a100=(a7*a29);
  a100=(a14*a100);
  a96=(a96+a100);
  a100=(a44*a29);
  a13=(a15*a37);
  a13=(a7*a13);
  a28=(a75*a13);
  a100=(a100+a28);
  a28=(a24*a100);
  a96=(a96+a28);
  a96=(a65*a96);
  a27=(a27+a96);
  a96=(a83*a37);
  a28=(a74*a26);
  a88=(a65*a88);
  a28=(a28+a88);
  a88=(a7*a28);
  a88=(a88-a13);
  a88=(a14*a88);
  a96=(a96+a88);
  a88=(a82*a37);
  a28=(a14*a28);
  a88=(a88+a28);
  a88=(a7*a88);
  a96=(a96-a88);
  a96=(a67*a96);
  a88=(a84*a90);
  a96=(a96-a88);
  a27=(a27-a96);
  a27=(a0-a27);
  a27=(a27/a69);
  a85=(a85/a69);
  a96=(a7*a90);
  a96=(a67*a96);
  a88=(a12*a90);
  a96=(a96+a88);
  a88=(a85*a96);
  a27=(a27+a88);
  a88=(a7*a26);
  a88=(a67*a88);
  a28=(a49*a90);
  a88=(a88-a28);
  a88=(a88/a69);
  a70=(a70/a69);
  a96=(a70*a96);
  a88=(a88+a96);
  a88=(a6*a88);
  a27=(a27+a88);
  a88=(a4*a27);
  a47=(a47+a88);
  a100=(a54*a100);
  a26=(a57*a26);
  a88=(a65*a27);
  a26=(a26+a88);
  a90=(a6*a90);
  a26=(a26-a90);
  a37=(a75*a37);
  a29=(a14*a29);
  a37=(a37+a29);
  a26=(a26-a37);
  a26=(a24*a26);
  a100=(a100-a26);
  a26=(a2*a100);
  a37=(a89*a26);
  a29=cos(a8);
  a90=(a36*a98);
  a90=(a2*a90);
  a88=(a29*a90);
  a96=(a21*a88);
  a27=(a2*a27);
  a28=(a86*a27);
  a96=(a96+a28);
  a28=(a7*a96);
  a28=(a81*a28);
  a37=(a37+a28);
  a28=(a18*a96);
  a13=(a15*a26);
  a13=(a7*a13);
  a38=(a72*a13);
  a28=(a28+a38);
  a38=(a24*a28);
  a37=(a37+a38);
  a37=(a60*a37);
  a8=sin(a8);
  a90=(a8*a90);
  a38=(a23*a90);
  a37=(a37-a38);
  a38=(a94*a88);
  a20=(a87*a26);
  a27=(a60*a27);
  a64=(a21*a90);
  a27=(a27-a64);
  a64=(a7*a27);
  a64=(a64-a13);
  a64=(a81*a64);
  a20=(a20+a64);
  a64=(a30*a26);
  a27=(a81*a27);
  a64=(a64+a27);
  a64=(a7*a64);
  a20=(a20-a64);
  a20=(a86*a20);
  a38=(a38+a20);
  a37=(a37-a38);
  a37=(a0-a37);
  a37=(a37/a58);
  a35=(a35/a58);
  a38=(a7*a88);
  a38=(a86*a38);
  a20=(a77*a88);
  a38=(a38+a20);
  a20=(a35*a38);
  a37=(a37-a20);
  a20=(a34*a88);
  a64=(a7*a90);
  a64=(a86*a64);
  a20=(a20-a64);
  a20=(a20/a58);
  a93=(a93/a58);
  a38=(a93*a38);
  a20=(a20-a38);
  a20=(a6*a20);
  a37=(a37+a20);
  a47=(a47+a37);
  a47=(a3*a47);
  a47=(a2*a47);
  if (res[5]!=0) res[5][0]=a47;
  a98=(a4*a98);
  a98=(a98-a33);
  a100=(a4*a100);
  a98=(a98+a100);
  a28=(a54*a28);
  a37=(a60*a37);
  a90=(a16*a90);
  a37=(a37-a90);
  a88=(a6*a88);
  a37=(a37+a88);
  a26=(a72*a26);
  a96=(a81*a96);
  a26=(a26+a96);
  a37=(a37-a26);
  a37=(a24*a37);
  a28=(a28-a37);
  a98=(a98+a28);
  a98=(a3*a98);
  a98=(a2*a98);
  if (res[5]!=0) res[5][1]=a98;
  a98=(a24*a9);
  a98=(a98/a17);
  a9=(a9*a98);
  a9=(a24*a9);
  a9=(a54+a9);
  a5=(a5*a9);
  a22=(a22*a5);
  a31=(a31*a22);
  a49=(a49*a31);
  a68=(a68*a22);
  a22=(a7*a68);
  a22=(a67*a22);
  a49=(a49-a22);
  a49=(a49/a69);
  a22=(a7*a31);
  a22=(a67*a22);
  a12=(a12*a31);
  a22=(a22+a12);
  a70=(a70*a22);
  a49=(a49-a70);
  a49=(a6*a49);
  a70=(a48*a9);
  a12=(a15*a70);
  a12=(a7*a12);
  a5=(a52*a12);
  a48=(a48*a98);
  a17=(a43*a48);
  a56=(a56*a17);
  a5=(a5-a56);
  a5=(a0+a5);
  a56=(a54*a5);
  a53=(a53*a70);
  a28=(a7*a17);
  a28=(a11*a28);
  a53=(a53-a28);
  a5=(a24*a5);
  a53=(a53+a5);
  a53=(a39*a53);
  a62=(a62*a70);
  a48=(a39*a48);
  a5=(a7*a48);
  a5=(a5+a12);
  a5=(a11*a5);
  a62=(a62-a5);
  a61=(a61*a70);
  a48=(a11*a48);
  a61=(a61-a48);
  a61=(a7*a61);
  a62=(a62-a61);
  a43=(a43*a62);
  a53=(a53-a43);
  a53=(a53/a46);
  a39=(a39*a53);
  a52=(a52*a70);
  a11=(a11*a17);
  a52=(a52-a11);
  a39=(a39+a52);
  a39=(a24*a39);
  a56=(a56+a39);
  a39=(a71*a56);
  a76=(a76*a39);
  a52=(a74*a31);
  a71=(a71*a53);
  a11=(a67*a71);
  a52=(a52-a11);
  a11=(a7*a52);
  a11=(a14*a11);
  a76=(a76+a11);
  a44=(a44*a52);
  a11=(a15*a39);
  a11=(a7*a11);
  a17=(a75*a11);
  a44=(a44+a17);
  a44=(a0+a44);
  a17=(a24*a44);
  a76=(a76+a17);
  a76=(a65*a76);
  a80=(a80*a68);
  a76=(a76-a80);
  a84=(a84*a31);
  a83=(a83*a39);
  a74=(a74*a68);
  a71=(a65*a71);
  a74=(a74+a71);
  a71=(a7*a74);
  a71=(a71+a11);
  a71=(a14*a71);
  a83=(a83-a71);
  a82=(a82*a39);
  a74=(a14*a74);
  a82=(a82-a74);
  a82=(a7*a82);
  a83=(a83-a82);
  a67=(a67*a83);
  a84=(a84+a67);
  a76=(a76-a84);
  a76=(a76/a69);
  a85=(a85*a22);
  a76=(a76+a85);
  a49=(a49-a76);
  a76=(a4*a49);
  a53=(a4*a53);
  a98=(a98+a53);
  a76=(a76-a98);
  a36=(a36*a56);
  a36=(a2*a36);
  a29=(a29*a36);
  a34=(a34*a29);
  a8=(a8*a36);
  a36=(a7*a8);
  a36=(a86*a36);
  a34=(a34-a36);
  a34=(a34/a58);
  a36=(a7*a29);
  a36=(a86*a36);
  a77=(a77*a29);
  a36=(a36+a77);
  a93=(a93*a36);
  a34=(a34-a93);
  a34=(a6*a34);
  a44=(a54*a44);
  a65=(a65*a49);
  a57=(a57*a68);
  a65=(a65-a57);
  a31=(a6*a31);
  a65=(a65+a31);
  a75=(a75*a39);
  a14=(a14*a52);
  a75=(a75+a14);
  a65=(a65-a75);
  a65=(a24*a65);
  a44=(a44-a65);
  a65=(a2*a44);
  a89=(a89*a65);
  a75=(a21*a29);
  a49=(a2*a49);
  a14=(a86*a49);
  a75=(a75+a14);
  a14=(a7*a75);
  a14=(a81*a14);
  a89=(a89+a14);
  a18=(a18*a75);
  a15=(a15*a65);
  a15=(a7*a15);
  a14=(a72*a15);
  a18=(a18+a14);
  a0=(a0+a18);
  a18=(a24*a0);
  a89=(a89+a18);
  a89=(a60*a89);
  a23=(a23*a8);
  a89=(a89-a23);
  a94=(a94*a29);
  a87=(a87*a65);
  a49=(a60*a49);
  a21=(a21*a8);
  a49=(a49-a21);
  a21=(a7*a49);
  a21=(a21-a15);
  a21=(a81*a21);
  a87=(a87+a21);
  a30=(a30*a65);
  a49=(a81*a49);
  a30=(a30+a49);
  a7=(a7*a30);
  a87=(a87-a7);
  a86=(a86*a87);
  a94=(a94+a86);
  a89=(a89-a94);
  a89=(a89/a58);
  a35=(a35*a36);
  a89=(a89+a35);
  a34=(a34-a89);
  a76=(a76+a34);
  a76=(a3*a76);
  a76=(a2*a76);
  if (res[5]!=0) res[5][2]=a76;
  a56=(a4*a56);
  a9=(a9+a56);
  a4=(a4*a44);
  a9=(a9+a4);
  a54=(a54*a0);
  a60=(a60*a34);
  a16=(a16*a8);
  a60=(a60-a16);
  a6=(a6*a29);
  a60=(a60+a6);
  a72=(a72*a65);
  a81=(a81*a75);
  a72=(a72+a81);
  a60=(a60-a72);
  a24=(a24*a60);
  a54=(a54-a24);
  a9=(a9+a54);
  a3=(a3*a9);
  a2=(a2*a3);
  if (res[5]!=0) res[5][3]=a2;
}

// Multi-threaded GPU code
template <typename scalar_t>
__global__ void dynamics_kernel_gpu(const scalar_t *q_in_ptr, const scalar_t *qdot_in_ptr, const scalar_t *tau_in_ptr, const scalar_t *h_in_ptr,
                                    scalar_t *q_out_ptr, scalar_t *qdot_out_ptr,
                                    int q_size, int num_threads)
{
  GPU_1D_KERNEL_LOOP(b, num_threads)
  {
    _dynamics_gpu(q_in_ptr + b * q_size, qdot_in_ptr + b * q_size, tau_in_ptr + b * q_size, h_in_ptr + b,
                  q_out_ptr + b * q_size, qdot_out_ptr + b * q_size);
  }
}

template <typename scalar_t>
__global__ void derivatives_kernel_gpu(const scalar_t *q_in_ptr, const scalar_t *qdot_in_ptr, const scalar_t *tau_in_ptr, const scalar_t *h_in_ptr,
                                       scalar_t *q_jac_q_ptr, scalar_t *q_jac_qdot_ptr, scalar_t *q_jac_tau_ptr,
                                       scalar_t *qdot_jac_q_ptr, scalar_t *qdot_jac_qdot_ptr, scalar_t *qdot_jac_tau_ptr,
                                       int q_size, int num_threads)
{
  GPU_1D_KERNEL_LOOP(b, num_threads)
  {
    _derivatives_gpu(q_in_ptr + b * q_size, qdot_in_ptr + b * q_size, tau_in_ptr + b * q_size, h_in_ptr + b,
                     q_jac_q_ptr + b * q_size * q_size, q_jac_qdot_ptr + b * q_size * q_size, q_jac_tau_ptr + b * q_size * q_size,
                     qdot_jac_q_ptr + b * q_size * q_size, qdot_jac_qdot_ptr + b * q_size * q_size, qdot_jac_tau_ptr + b * q_size * q_size);
  }
}

// Torch CPU wrapper
std::vector<torch::Tensor> dynamics_gpu(torch::Tensor q_in, torch::Tensor qdot_in, torch::Tensor tau_in, torch::Tensor h_in)
{
  int batch_size = q_in.size(0);
  int q_size = q_in.size(1);
  torch::Tensor q_out = torch::zeros_like(q_in);
  torch::Tensor qdot_out = torch::zeros_like(q_in);
  using scalar_t = double;

  dynamics_kernel_gpu<scalar_t><<<NUM_BLOCKS(batch_size), NUM_THREADS>>>(
      q_in.data_ptr<scalar_t>(),
      qdot_in.data_ptr<scalar_t>(),
      tau_in.data_ptr<scalar_t>(),
      h_in.data_ptr<scalar_t>(),
      q_out.data_ptr<scalar_t>(),
      qdot_out.data_ptr<scalar_t>(),
      q_size,
      batch_size);

  return {q_out, qdot_out};
}

std::vector<torch::Tensor> derivatives_gpu(torch::Tensor q_in, torch::Tensor qdot_in, torch::Tensor tau_in, torch::Tensor h_in)
{
  int batch_size = q_in.size(0);
  int q_size = q_in.size(1);
  torch::Tensor q_jac_q = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor q_jac_qdot = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor q_jac_tau = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor qdot_jac_q = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor qdot_jac_qdot = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor qdot_jac_tau = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  using scalar_t = double;

  derivatives_kernel_gpu<scalar_t><<<NUM_BLOCKS(batch_size), NUM_THREADS>>>(
      q_in.data_ptr<scalar_t>(),
      qdot_in.data_ptr<scalar_t>(),
      tau_in.data_ptr<scalar_t>(),
      h_in.data_ptr<scalar_t>(),
      q_jac_q.data_ptr<scalar_t>(),
      q_jac_qdot.data_ptr<scalar_t>(),
      q_jac_tau.data_ptr<scalar_t>(),
      qdot_jac_q.data_ptr<scalar_t>(),
      qdot_jac_qdot.data_ptr<scalar_t>(),
      qdot_jac_tau.data_ptr<scalar_t>(),
      q_size,
      batch_size);

  return {q_jac_q, q_jac_qdot, q_jac_tau, qdot_jac_q, qdot_jac_qdot, qdot_jac_tau};
}
