ASG
IBM
Zystems
Cressida
Icon
Netflexity
 
  MQSeries.net
Search  Search       Tech Exchange      Education      Certifications      Library      Info Center      SupportPacs      LinkedIn  Search  Search                                                                   FAQ  FAQ   Usergroups  Usergroups
 
Register  ::  Log in Log in to check your private messages
 
RSS Feed - WebSphere MQ Support RSS Feed - Message Broker Support

MQSeries.net Forum Index » General IBM MQ Support » missing event in SYSTEM.ADMIN.CHANNEL.EVENT queue

Post new topic  Reply to topic
 missing event in SYSTEM.ADMIN.CHANNEL.EVENT queue « View previous topic :: View next topic » 
Author Message
gunter
PostPosted: Fri Jan 05, 2007 7:01 am    Post subject: missing event in SYSTEM.ADMIN.CHANNEL.EVENT queue Reply with quote

Partisan

Joined: 21 Jan 2004
Posts: 307
Location: Germany, Frankfurt

Hi,

we use the events in queue SYSTEM.ADMIN.CHANNEL.EVENT to monitor the state of our application.
After a network failure I found in our log only the first problem AMQ9208(RETRYING) and the last message AMQ9002(START_CHANNEL).
I missed the attempt and the errors while retrying to start the channel.

I ask for the AMQERR01.LOG an found this entries:
ok - found in queue
? - missed in queue
AMQ9208 - ok
AMQ9002 - ?
AMQ9213 - ?
AMQ9002 - ?
AMQ9585 - ?
AMQ9002 - ?
AMQ9002 - ok

A look in the code shows, that there is no way around reporting an event in the queue. Is this normal and is this behavior dokumented?

Thanks in advance.

Regards

Gunter
_________________
Gunter Jeschawitz
IBM Certified System Administrator - Websphere MQ, 5.3
Back to top
View user's profile Send private message
pathipati
PostPosted: Fri Jan 05, 2007 8:20 pm    Post subject: Reply with quote

Master

Joined: 03 Mar 2006
Posts: 296

what did you see exactly in AMQERR01.LOG ?
Back to top
View user's profile Send private message Yahoo Messenger
gunter
PostPosted: Mon Jan 15, 2007 6:09 am    Post subject: Reply with quote

Partisan

Joined: 21 Jan 2004
Posts: 307
Location: Germany, Frankfurt

Hi,

sorry answering so late, I wasn't in the office.

Here are the complete messages.
The channel is configured only to retry thre times with a 60 s timeout.
We read the event queue and if we get messeges we inquire channel state to report the actual state. RETRY is not an error, we wait for RUNNING or STOPPED. The system works for fife years without problems.

But here the retries are in the AMQERR01.LOG but not in the event queue.
Every start should be reported twice, one message for the request and one for the result. An exeption is if the listener or the queuemanager starts the channel, then the request results not in a message.

But where are the messages reporting the errors( AMQ9213, AMQ9558, AMQ9202) ?

I will change the code, so the application polls on the channel state if one channel is retrying. That will fix our problem, but I also like to understand what was happening and how works mq really.

Thanks for any help.

Gunter

Code:
-------------------------------------------------------------------------------
04.01.2007  07:37:05
AMQ9208: Fehler beim Empfangen von Host '10.1.1.1'.

ERKLÄRUNG:
Beim Datenempfang von '10.1.1.1' über 'TCP/IP' ist ein Fehler aufgetreten.
Dies ist möglicherweise auf einen Datenübertragungsfehler zurückzuführen.
AKTION:
Der Rückkehrcode des Aufrufs 'TCP/IP (recv)' lautete '10054' (X'2746').
Notieren Sie diese Werte, und benachrichtigen Sie den Systemadministrator.
----- amqccita.c : 2761 -------------------------------------------------------
04.01.2007  07:37:05
AMQ9999: Das Kanalprogramm wurde abnormal beendet.

ERKLÄRUNG:
Das Kanalprogramm 'CHANNEL1' wurde abnormal beendet.
AKTION:
Prüfen Sie vorherige Fehlernachrichten für Kanalprogramm 'CHANNEL1'
in den Fehlerdateien, um die Fehlerursache festzustellen.
----- amqrccca.c : 804 --------------------------------------------------------
04.01.2007  07:37:15
AMQ9002: Kanalprogramm gestartet.

ERKLÄRUNG:
Das Kanalprogramm 'CHANNEL1' wurde gestartet.
AKTION:
Keine.
-------------------------------------------------------------------------------
04.01.2007  07:37:35
AMQ9213: Übertragungsfehler bei TCP/IP aufgetreten.

ERKLÄRUNG:
Es ist ein unerwarteter Fehler bei der Datenübertragung aufgetreten.
AKTION:
Der Rückkehrcode des Aufrufs TCP/IP(recv) [TIMEOUT] 20 seconds lautete 0
(X'0'). Notieren Sie diese Werte, und benachrichtigen Sie den
Systemadministrator.
----- amqccita.c : 2727 -------------------------------------------------------
04.01.2007  07:37:35
AMQ9999: Das Kanalprogramm wurde abnormal beendet.

ERKLÄRUNG:
Das Kanalprogramm 'CHANNEL1' wurde abnormal beendet.
AKTION:
Prüfen Sie vorherige Fehlernachrichten für Kanalprogramm 'CHANNEL1'
in den Fehlerdateien, um die Fehlerursache festzustellen.
----- amqrccca.c : 804 --------------------------------------------------------
04.01.2007  07:38:15
AMQ9002: Kanalprogramm gestartet.

ERKLÄRUNG:
Das Kanalprogramm 'CHANNEL1' wurde gestartet.
AKTION:
Keine.
-------------------------------------------------------------------------------
04.01.2007  07:38:15
AMQ9558: Ferner Kanal ist derzeit nicht verfügbar.

ERKLÄRUNG:
Das Kanalprogramm wurde beendet, da der Kanal 'CHANNEL1' derzeit
nicht auf dem fernen System zur Verfügung steht. Möglicherweise ist der Kanal
inaktiviert oder das ferne System verfügt nicht über ausreichend Ressourcen, um
einen weiteren Kanal auszuführen.
AKTION:
Das ferne System prüfen, um sicherzustellen, daß der Kanal ausgeführt und die
Operation wiederholt werden kann.
----- amqrfpta.c : 334 --------------------------------------------------------
04.01.2007  07:38:15
AMQ9999: Das Kanalprogramm wurde abnormal beendet.

ERKLÄRUNG:
Das Kanalprogramm 'CHANNEL1' wurde abnormal beendet.
AKTION:
Prüfen Sie vorherige Fehlernachrichten für Kanalprogramm 'CHANNEL1'
in den Fehlerdateien, um die Fehlerursache festzustellen.
----- amqrccca.c : 804 --------------------------------------------------------
04.01.2007  07:39:15
AMQ9002: Kanalprogramm gestartet.

ERKLÄRUNG:
Das Kanalprogramm 'CHANNEL1' wurde gestartet.
AKTION:
Keine.
-------------------------------------------------------------------------------
04.01.2007  07:39:34
AMQ9202: Ferner Host '10.1.1.1 (1414)' nicht verfügbar. Anforderung später
wiederholen.

ERKLÄRUNG:
Der Versuch, einen Datenaustausch mit TCP/IP dem Host '10.1.1.1 (1414)'
zuzuordnen, war nicht erfolgreich. Möglicherweise handelt es sich um ein
vorübergehendes Problem, und es kann zu einem späteren Zeitpunkt ein
TCP/IP-Datenaustausch zugeordnet werden.
AKTION:
Die Verbindung zu einem späteren Zeitpunkt erneut versuchen. Bleibt der Fehler
bestehen, die Fehlerdaten notieren und den Systemadministrator benachrichtigen.
Rückkehrcode von TCP/IP : 10060 (X'274C'). Die Ursache des Fehlers ist
möglicherweise, daß dieser Host keine Verbindung zum Ziel-Host aufbauen kann.
Eine andere mögliche Ursache ist, daß das Empfangsprogramm bei Host '10.1.1.1
(1414)' nicht aktiv war. Wenn dies der Fall ist, die erforderlichen Operationen
ausführen, um das TCP/IP-Empfangsprogramm zu starten, und die Anforderung
wiederholen.
----- amqccita.c : 973 --------------------------------------------------------
04.01.2007  07:39:34
AMQ9999: Das Kanalprogramm wurde abnormal beendet.

ERKLÄRUNG:
Das Kanalprogramm 'CHANNEL1' wurde abnormal beendet.
AKTION:
Prüfen Sie vorherige Fehlernachrichten für Kanalprogramm 'CHANNEL1'
in den Fehlerdateien, um die Fehlerursache festzustellen.
----- amqrccca.c : 804 --------------------------------------------------------
04.01.2007  09:06:27
AMQ9002: Kanalprogramm gestartet.

ERKLÄRUNG:
Das Kanalprogramm 'CHANNEL1' wurde gestartet.
AKTION:
Keine.
-------------------------------------------------------------------------------

_________________
Gunter Jeschawitz
IBM Certified System Administrator - Websphere MQ, 5.3
Back to top
View user's profile Send private message
fjb_saper
PostPosted: Mon Jan 15, 2007 7:18 am    Post subject: Reply with quote

Grand High Poobah

Joined: 18 Nov 2003
Posts: 20756
Location: LI,NY

Well Guenter, looks like you hit a specific situation.
There is nothing wrong with your qmgr.
There is nothing wrong with the target qmgr.
The resources allocated to the target qmgr are not sufficient.

2 avenues of research:
The target's max channels is set too low....
There was a glitch in the network and you may need to
  1. force/terminate the receiver channel then restart it.
  2. check for a denial of service attack (too many connection attempts on a port)
  3. too slow a network (queue for a specific port got too big)
  4. The listener is not running under mqm group (unlikely)
  5. etc...

Enjoy
_________________
MQ & Broker admin
Back to top
View user's profile Send private message Send e-mail
gunter
PostPosted: Mon Jan 15, 2007 8:45 am    Post subject: Reply with quote

Partisan

Joined: 21 Jan 2004
Posts: 307
Location: Germany, Frankfurt

Hi fjb_saper,

we had a power failure, hence a few router failed. That's, at least for me, not the problem. My problem is the behavior of mq in this situation.

I expected more messages in the SYSTEM.ADMIN.CHANNEL.EVENT queue.

Thanks Gunter
_________________
Gunter Jeschawitz
IBM Certified System Administrator - Websphere MQ, 5.3
Back to top
View user's profile Send private message
Nigelg
PostPosted: Mon Jan 15, 2007 1:14 pm    Post subject: Reply with quote

Grand Master

Joined: 02 Aug 2004
Posts: 1046

There is no one-to-one correlation between the msgs in the error log and the msgs written to the event queue. The msgs written to the queue are documented in the Events manual.
_________________
MQSeries.net helps those who help themselves..
Back to top
View user's profile Send private message
gunter
PostPosted: Tue Jan 16, 2007 6:19 am    Post subject: Reply with quote

Partisan

Joined: 21 Jan 2004
Posts: 307
Location: Germany, Frankfurt

Thanks Nigelg,

I read the event monitoring manual again and found this:

Quote:
MQRC_CHANNEL_STOPPED
It will only be issued if the channel
instance previously issued a channel started event.


It must be the key to my problem.
I tested it:

- If a channel is started by command, there is an event for the request and one for the result, stopped(error/retrying) or started.
- If the result is stopped-retrying, the start-events for the retries are not reported and therefore the resulting errors are not reported.
- If a start is successfull, an event is reported.
- If the channel stopps by an error after a successfull start, the error results in an event
- There is no event if the channel goes from stopped-retying to stopped-error
_________________
Gunter Jeschawitz
IBM Certified System Administrator - Websphere MQ, 5.3
Back to top
View user's profile Send private message
Nigelg
PostPosted: Wed Jan 17, 2007 1:46 am    Post subject: Reply with quote

Grand Master

Joined: 02 Aug 2004
Posts: 1046

This was changed to the current behaviour in IC29815 (qv), in Aug 2002. The behaviur prior to the APAR can be restored by adding a Channels stanza tuning parameter StopEvent = Always.
_________________
MQSeries.net helps those who help themselves..
Back to top
View user's profile Send private message
Display posts from previous:   
Post new topic  Reply to topic Page 1 of 1

MQSeries.net Forum Index » General IBM MQ Support » missing event in SYSTEM.ADMIN.CHANNEL.EVENT queue
Jump to:  



You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum
Protected by Anti-Spam ACP
 
 


Theme by Dustin Baccetti
Powered by phpBB © 2001, 2002 phpBB Group

Copyright © MQSeries.net. All rights reserved.